KMeans as a classifier for the WIFI and MNIST datasets – I – Cluster analysis of the WIFI example

In the November and December 2021 editions of the German “Linux Magazin” R. Pleger discussed a simple but nevertheless interesting example for the application of a cluster algorithm. His test case was based on a dataset of the UCI Irvine. This dataset contains 2000 samples with (fictitious?) data describing WIFI signals which stemmed from seven WLAN spots around a building. The signal strength of each source was measured at varying positions in four different rooms. I call the whole setup the “WIFI example” below.

One objective of the articles in the Linux Magazin was to demonstrate how simple it is today to apply basic Machine Learning methods. In a first step the author used a ML classifier algorithm to determine the location (i.e. the room) of a measuring instrument just from the strengths of the different WIFI signals. This task can be solved by a variety of algorithms – e.g. by a Decision Tree, SVM/SVC or a simple Multilayer Perceptron. The author used Sklearn’s RandomForestTree. This method is a good example for the powerful “Ensemble Learning” technique. When applied to the simple and well structured WIFI example it predicts the rooms for test samples with an accuracy of more than 98%.

The author afterward performed a deeper analysis of the WIFI data via Kmeans, MiniBatchKMeans and PCA. His second article underlined a major question, which sometimes is not taken seriously enough:

Do the data, which we feed into ML algorithms, really cover all aspects of the problem? Is the set of target labels complete or sufficient in the sense that the separation of the samples into labeled groups really reflects the problem’s internal structure? Or do the data contain more information than the labels reveal?

Unfortunately, in my opinion, the Linux Magazine covered an important point, namely the relation of the results of a PCA analysis to a 2-dimensional cluster visualization, in an incomplete and also slightly misleading way. In addition another interesting question was not discussed at all:

Can we use KMeans also as a classifier? How would we do this?

In this series of posts I want to dig a bit deeper into these topics – both for the WIFI example and also for the MNIST dataset. For MNIST we will not be able to visualize clusters as easily as for the WIFI example. Therefore, we should have a clear idea about what we do when we use clusters for classifying.

In this first post I focus on the results of a cluster analysis for the WIFI example. In a second article I will discuss the relation of cluster results to a PCA analysis. A third post will then present a very simple method of how to turn a cluster algorithm into a classifier algorithm. In later articles we shall transfer our knowledge to the MNIST data. More precisely: We shall combine a PCA analysis with a cluster classifier to predict the labels of handwritten digit images. We will use the PCA technique to reduce the dimensions of the MNIST feature space from 784 down to below 80. It will be interesting to see what accuracy we can reach with a relatively crude clustering approach on only about 30 main PCA components. As a side aspect we shall also have a look at standardization and normalization of the MNIST data.

I do not present any code in the first three posts as the required Python programs can be build relatively straight-forward and most of the core statements were already given in the Linux Magazin. You unfortunately have to buy the articles of the magazine; but see https://www.linux-magazin.de/ausgaben/2021/11/maschinenlernen/. However, as soon as we turn to MNIST I shall provide a Jupyter notebook.

The WIFI example: Two thousand samples, each with data for the signal strength of seven WLAN sources measured in four rooms

You can download the data WIFI data set from the following address:
https://archive.ics.uci.edu/ml/machine-learning-databases/00422/wifi_localization.txt

The feature space of this is example is 7-dimensional: 7 WLAN spots provide WIFI signals in the building. We have 2000 samples. Each sample provides the signal strength of each of the WLAN sources measured at different times and positions within a specific room. An integer number in [1,4] is provided as a label which identifies the room. The following plot shows the interpolated frequency distribution over the signal strength for each of the 7 signals in the four rooms:

Cluster analysis of the WIFI data – more than four rooms?

The original label-data of the WIFI example imply the existence of four rooms. But can we trust this information? The measurements in the room, which we called “Diele” in the plots above, indicate a consistent second peak for both the signals 0 and 3. Is this due to an opening into another room?

A simple method to analyze the inner structure of the distribution of data points in a configuration or feature space is a “cluster analysis”. The KMeans algorithm provides such an analysis for an assumed number of clusters.

KMeans is a basic but important ML method which reveals a lot about the data distribution in feature space and indirectly about the complexity of hyperplanes required to separate data according to their labels. Among other things KMeans determines the positions of cluster centers – the so called centroids – by measuring and systematically optimizing distances of samples to assumed centroids. Actually, the sum over all intra-cluster variances, i.e. the summed quadratic distances of the associated samples to their cluster’s centroid, is minimized. The respective quantity is called “inertia” of the cluster distribution. See e.g. the excellent book of P. Wilmott, Machine learning – an applied mathematics introduction” on this topic.

A simple method to find out into how many clusters a distribution probably segregates is to look for an elbow in the variation of the inertia with the number of clusters. When we look at the variation of inertia values with the number of potential clusters “k” for the WIFI example we get the following curve:

This indicates an elbow at k=4,5.

Another method to identify the most probable number of distinct clusters in a multi dimensional data point distribution is the so called “silhouette analysis”. See the book of A. Geron “Hands-On Machine Learning with Scikit-Learn, Keras and Tensorflow”, 2n edition, for a description. For the WIFI example the plots of the silhouette score data support the result of the elbow analysis:

The second plot shows ordered silhouette data for k = 3,4,5,6 clusters. Again, we get the most consistent pictures for k=4 and k=5.

So, the data indicate a fragmentation into 4 or 5 clusters. How can we visualize this with respect to the feature space?

Scatter plots for 2-dim sub-spaces of the feature space

A general problem with the visualization of cluster data for multidimensional data is that we are limited to 2, maximal 3 dimensions. And a projection down to two dimensions may not reflect the real cluster separation in the multidimensional feature space in a realistic way. But sometimes we are lucky.

We shall later see that there are two primary components which dominate the data and signal distributions in the WIFI example. A major question, however, is whether we will also find that only a few original features contribute dominantly to these major components. A PCA analysis does not mean that a “primary component” only depends on the same number of features!

As I did not know the relation of “primary components” to features I just plotted the results of “KMeans” for a variety of 2-dim signal combinations. I used Sklearn’s version of KMeans; due to the very small data ensemble KMeans is applicable without consuming too much CPU time (this will change with MNIST; there we need to invoke MiniBatchKMeans):

Note that the colorization of the data points in all plots was done with respect to the cluster number predicted by KMeans for the samples – and not with respect to their labels.

It is interesting that the projections onto two special feature combinations – namely WLAN-4/WLAN 0 and WLAN-3/WLAN-0 signal – show a very distinct separation of the clusters.

Four or five clusters ?

The data displayed above depend a bit on the initial distribution of cluster centers as an input into the KMeans algorithm. But for 4 and 5 clusters we get very consistent results. The next plots show the positions of the centroids:

This time the colorization was done with respect to the labels. What we see is: Five clusters represent the situation a bit better than only 4 clusters.

When we align this with the rooms: Five “rooms” may describe the signal variation better than only 4 rooms. The reason for this might be that one of the four rooms has a wall which partially separates different areas from another. We often find this in “entrances” [German: “Diele”] to houses. Sketches of the rooms in the Linux Magazin article actually show that this is the case. And, of course, such a wall or an opening into another room would have an impact on the damping of the WLAN signals.

Addendum 19.03.2022: Comparing clusters with groups of labeled data points

An important question which we have not answered yet by the images shown above is the following:

How well do clusters coincide with groups of data points having a specific label?

Note that in general you can not be sure that clusters reflect data points of the same label. Actually, a cluster is only a way to describe a close spatial vicinity of data points in some region of the multidimensional feature space. I.e. some kind of clumping of the data points around some centroids. But spatial vicinity does not necessarily reflect a label: A label border may often separate data points which are very close neighbors. And a cluster may contain a mixture of samples with different labels ….

Well, in the case of the WIFI example the identified 4 to 5 clusters match the groups of data points with different labels quite well. Below I superimposed the sample’s data points with different colors: First I colorized the data points according to their label. On top of the resulting scatter plot I placed the same data points again, but this time with a different and transparent colorization according to their cluster association. In addition I shifted the second data layer a bit to get a better contrast:

You see that the areas are not completely identical, but they overlap quite well. Obviously, I used 5 clusters. Also the fifth cluster fits well into a region characterized by just one label.

Conclusion

The simple WIFI example shows that a cluster analysis may give you new insights into the structure of ML data sets which a simple classifier algorithm can not provide. In the next article

KMeans as a classifier for the WIFI and MNIST datasets – II – PCA in combination with KMeans for the WIFI-example

we shall link the information contained in the “clusters” to the results of a PCA analysis of the WIFI example.

Stay tuned …

Ceterum censeo: The most important living fascist which must be denazified is the Putler.

Münchens LIMUX und ein Editorial des Linux-Magazins

Eine Bekannte hat mich im September diesen Jahres fast schadenfroh darauf aufmerksam gemacht, dass das LIMUX-Projekt der Stadt München in Gefahr sei. Verwiesen hat sie in diesem Zusammenhang auf einen Artikel in der SZ:
http://www.sueddeutsche.de/muenchen/muenchner-stadtverwaltung-von-microsoft-zu-linux-und-zurueck-1.2090611

Auch wenn inzwischen im Magazin Linux-User und in anderen Zeitungen “Entwarnung” gegeben wurde, lohnt es sich dennoch, sich etwas ausführlicher mit dem Vorgang zu befassen. Ein Grund unter mehreren ist für mich die Art und Weise, wie in diesem Fall von einem nicht ganz unwichtigen Linux-Befürworter mit Kritik an einem Linux-Desktop umgegangen wurde. Aus meiner Sicht wurde – wie zu oft – zu schnell abgebügelt. Dabei bleiben dann valide Punkte auf der Strecke, und man kocht schön weiter im eigenen Saft. Ist ja auch bequemer so …

Aber der Reihe nach.

Eine Diskussion zum LIMUX-Projekt mit IT-Professionellen in meinem Bekanntenkreis verläuft meist so,

  • dass Linux-Befürworter das Desktop-Projekt der Münchner Stadtverwaltung als Beleg dafür heranziehen, dass Linux sehr wohl auch am Arbeitsplatz und nicht nur auf Servern einsetzbar sei,
  • dass Linux-Skeptiker dagegen den Nutzen und die Einsparungen bezweifeln,
  • dass Linux-Skeptiker grundsätzlich nicht glauben, dass die betroffenen Anwender zufrieden sind und sie dafür gerne belastbare Belege sehen würden.

Dabei sind die Linux-Skeptiker – meist Leute, die täglich mit Windows arbeiten und oft auch eine frustrierende Erfahrung mit dem Versuch einer eigenen Linux-Installation hinter sich haben – in der erdrückenden Überzahl. (Das sind natürlich trotzdem nette Menschen …). Repäsentatives, belastbares Material zu Kosten und User-Zufriedenheit im Umgang mit Linux-Desktops legen beide Seiten in der Regel nicht vor. Und nur selten werden die Anforderungen an einen modernen Desktop in der Arbeitswelt und die erforderlichen Applikationen als Grundlage einer sachlichen Diskussion spezifiziert.

Die SZ-Nachricht platzte ins Ende der Sommerpause. So ging das Thema in der interessierten Öffentlichkeit zunächst fast unter. In der kurz darauf erschienenen Ausgabe 10/14 des Linux-Magazins, in dem das LIMUX-Projekt auch schon in der Vergangenheit (trotz vieler Verzögerungen und Probleme) vielfach gelobt wurde, platzierte man LIMUX auf Platz 11 unter den größten 20 “Tops” der Linux-Geschichte.

Generell ist festzuhalten, dass das LIMUX-Projekt in den deutschen Postillen der Linux-Welt immer wieder als Vorzeige-Projekt dargestellt und positiv kommentiert wurde. So wurde im Linux-Magazin oder in der Schwester-Zeitschrift Linux-User mal der Fortschritt des Rollouts auf geplante ca. 15000 Arbeitsplätze positiv gewürdigt oder der wohltuende Einfluss von Ubuntu auf das Projekt hervorgehoben.

Nach genauem Studium der jeweiligen Artikel fällt auf, dass das SW- und Applikationsangebot des LIMUX-Desktops auch in der Fachpresse so gut wie nie spezifiziert oder diskutiert wurde. Auch als Linux-Befürworter fragt man sich zwangsläufig, wieviel die Autoren eigentlich über den wahren Leistungsstand des LIMUX-Desktops im Vergleich z.B. zu einem aktuellen KDE 4.x-Linux-Desktop in einer dazu passenden leistungsfähigen Serverlandschaft recherchiert hatten. Siehe zu aktuellen Spekulationen bzgl. dieses offenen Punktes etwa
https://debianforum.de/forum/viewtopic.php?f=15&t=150995. Überhaupt ist die Frage zu stellen, welcher Maßstab eigentlich zur Bewertung des Erfolges eines SW-Rollouts heranzuziehen wäre – die Tatsache, dass der Rollout für die geplante Useranzahl gelungen ist, reicht alleine vielleicht nicht. So wäre u.a. die weiterführende Frage zu
stellen:
Was zeichnet eigentlich das LIMUX-Anwendungsangebot im Verhältnis zu den Bedürfnissen von Verwaltungsangestellten aus ?

Es verwundert wenig, dass in einem faktenarmen Diskussionsumfeld bei den Linux-Skeptikern angesichts der SZ-Meldung ein Schuss Schadenfreude zu spüren war. Aber schon früher kam offene Kritik – manchmal sogar aus einer Ecke, wo zumindest ich das zuletzt erwartet hätte (http://www.silicon.de/41595329/ob-kandidatin-kritisiert-limux-projekt-in-muenchen/). Auf der anderen Seite machen es sich die Linux-Befürworter zu leicht, wenn sie den Erfolg von LIMUX oftmals ausschließlich am Projektverlauf festmachen. Wenn dann plötzlich Kritik an der Leistungsfähigkeit auftaucht, ist man eher überrascht.

Wie reagierten nun publizistische Vertreter der Linux-Community auf die Kritik der Münchner Bürgermeister?

Ein Editorial im Linux-Magazin

Im Linux-Magazin 11/2014 bezog als einer der Ersten Chefredakteur Jan Kleinert Stellung:

In seinem Editorial “Ende der Fahnenstange” werden der Münchner OB und einer der Bürgermeister als “Außerirdische” karikiert, die nicht verstünden, um welch komplexe Technik es sich bei den eingeführten Systemen handeln würde. LIMUX wird dabei salopp mit “IT einer 1,4 Millionen Stadt” gleichgesetzt. Herr Kleinert verweist ferner darauf, dass ein Tablet-PC (oder gar ein Handy) nur wenig komplexe Aufgaben zu verrichten habe und deshalb (im Gegensatz zu einem Desktop?) eine gute Usability bieten könne. Ferner sei Sicherheit (“Funktionssicherheit”) beim Tablet-PC nur mäßig relevant (?!?). Kleinerts Text impliziert weiter, dass Linux in der Verwaltung einer Millionenstadt natürlich wesentlich mehr und Fundamentaleres leisten müsse – er rekuriert dabei nach meiner Ansicht in völlig unangebrachter Weise auf das extreme Beispiel der Steuerung von Brennstäben in Reaktoren. Damit sollte wohl das Spektrum an IT-Anwendungen und Technologie aufgezeigt werden. Bei der sensiblen Reaktorsteuerung kämen ja auch nicht moderne Usability-Kriterien zum Tragen. Die von einem der aktuellen Münchner Bürgermeister vorgebrachte Kritik, dass er zu Hause unter Linux nicht mal einen mobilen E-Mail- und Kalender-Client zur Verfügung habe, erscheint im Kontext der Gedankenführung des Editorials dann natürlich fast kleingeistig. Das Wesen der IT bestehe im Gegensatz zur geäußerten Kritik an LIMUX eben im Kompromiss zwischen Komplexität, Funktionssicherheit und Innovation. Aha!

Alles also nur eine fachlich unfundierte, politische Welle der neuen Stadtregierung? Vorgebracht von voreingenommenen Linux-Skeptikern? (Zu denen manche gerade die Bürgermeister zählen; s. http://www.linux-magazin.de/NEWS/Microsoft-Fan-Muenchens-neuer-OB-Reiter-will-in-Sachen-Limux-neue-Loesung-finden, http://www.heise.de/open/meldung/Muenchner-Buergermeister-sieht-deutliche-Schwaechen-bei-LiMux-2391735.html, http://www.golem.de/news/limux-kopf-einziehen-und-ueber-verschwoerung-tuscheln-1412-110908-4.html).

Ich habe dazu eine andere – und durchaus kritischere – Meinung als der ansonsten von mir sehr geschätzte Herr Kleinert. Denn selbst wenn man den von ihm geforderten Kompromiss als Basis für die Bewertung einer bereits in die Jahre gekommenen IT-Lösung heranziehen würde, könnte man die Kritik der Bürgermeister ja so deuten, dass die LIMUX-Lösung unter den vielen technischen Möglichkeiten womöglich gerade nicht den optimalen Kompromiss darstellt. Und das führt dann zu einer Fragestellung, bei der
auch Herr Kleinert mit Sicherheit einige Mühe hätte, eine faire und vor allem fundierte Antwort zu finden.

Im Gegensatz zu den professionellen Linux-Meinungsmachern erlaube ich mir ferner, den Verdacht zu hegen, dass sich in den zitierten Äußerungen der Bürgermeister (neben einer evtl. politisch begründeten Neuausrichtung der IT-Politik der Stadt München) eine vielleicht nicht nur positive Erfahrung der inzwischen vielen Anwender bei der Landeshauptstadt München ihren Weg bahnt. Auch wenn wir das als Linux-Anhänger natürlich nicht gerne hören mögen. Denn vielleicht hat ja gerade die Einführung von etlichen sich schnell entwickelnden und lange Zeit keinesfalls fehlerfreien Linux-Anwendungen (wie etwa das wohl auch unter LIMUX genutzte Thunderbird, Open- bzw. Libreoffice sowie etliche KDE-Applikationen) oder gar ein Mangel an integrierten Anwendungen die gewohnte “Funktionssicherheit” aus Sicht der Anwender beeinträchtigt ?

Je mehr ich im Laufe der vergangenen 2 Monate darüber nachdachte, desto mehr ärgerte mich eigentlich das Editorial von Herrn Kleinert, dessen Aufmacher im Linux-Magazin und dessen kritische Begleitung aktueller Ereignisse im Linux- und IT-Umfeld ich ansonsten wirklich sehr schätze. Das sei ausdrücklich gesagt!

Der Grund meines Ärgers ist die Pauschalisierung bei der Abqualifizierung von vermeintlich unbedarften Nutzern, die schnell als eingefleischte Linux-Skeptiker entlarvt werden. Aber müssen wir uns als Linux-Befürworter nicht gerade der Kritik dieser Leute stellen ? Nicht nur bei Herrn Kleinert kommt leider viel zu oft das Muster zum Tragen, sich selbst mit Verweis auf die Inkompetenz und die Vorurteile anderer konsequent an der kritischen Betrachtung eventuell ausgeblendeter Fakten und Hintergründe zu hindern.

Warum ist das Editorial des Linux-Magazins wenig hilfreich?

Die Haltung des Editorials im Linux-Magazin verdient aus meiner Sicht deutliche Kritik :

So geht der Leitartikel des Linux-Magazin bezeichnenderweise nicht darauf ein, dass es sich beim LIMUX-Projekt und dem zugehörigen Rollout primär um Desktop-Technologie handelt. Ob die funktioniert, können die Betroffenen – darunter auch die Bürgermeister – ja womöglich doch aus eigener Anschauung beurteilen. Denn was ein moderner Desktop an Mindestfunktionalität bieten kann oder muss, erfahren sie nicht nur im eigenen täglichen Umgang mit der bereitgestellten Funktionalität. Nein, sie sehen Beispiele für andere Lösungen selbstverständlich auch an den Arbeitsplätzen anderer Verwaltungsorganisationen. Oder erleben im persönlichen Kontakt, welche Möglichkeiten andere Bürgermeister und Verwaltungsangestellte mit deren dienstlichen, mobilen Devices nutzen können. Und dann könnte es ja zumindest theroretisch möglich sein, dass der Vergleich für den einen oder anderen betroffenen Münchner Anwender aus guten Gründen negativ für LIMUX ausfällt – nicht nur bei oberflächlicher Betrachtung.

Der direkte Vergleich mit anderen Benutzeroberflächen wartet beim normalen Anwender zudem meist zu Hause – in Form von Windows-PCs, modernen Smartphones, Tablet-PCs … Trotz aller berechtigten Sicherheitsfragen – der moderne Linux-Desktop muss sich an der von anderen Systemen gebotenen Usability messen lassen. (Wobei ich keine Zweifel habe, dass ein aktueller Linux-Desktop dabei sehr gut abschneiden würde, wenn denn im Rahmen der finanziellen Möglichkeiten das Beste aus dem Desktop und den im Hintergrund zu nutzenden Serverdiensten herausgeholt würde).

Warum Herr Kleinert das Anliegen eines Managers (und als solchen sehe ich einen Bürgermeister unter anderem), einen mobilen E-Mail- und Kalender-Client mit Anbindung an einen städtischen Mailserver nutzen zu wollen, übel nimmt, verstehe ich nun überhaupt nicht. Das ist aus meiner Sicht zunächst ein völlig (!) berechtigtes Anliegen – ebenso wie der Abgleich der mobilen Devices mit Client-Applikationen am Arbeitsplatz oder
bestimmten Inhalten bestimmter Server. Typischerweise erledigt man diese Aufgaben an einem Windows-Arbeitsplatz über eine Groupware-Anwendung. Nun dürfte auch Hrn. Kleinert nicht verborgen geblieben sein, dass gerade dieser Bereich eine Schwachstelle so mancher Opensource-Group- und Kollaborations-Software darstellt. Aber stellt er die für eine sachliche Bewertung erforderliche Frage, was LIMUX denn in diesem Bereich an Lösung anbietet?

Dass man im Zuge einer Umsetzung der genannten Ansprüche Sicherheitsaspekte bedenken und dem User Kompromisse abnötigen muss, versteht sich von selbst. Aber Schritt 1 ist, die Anforderung des Users ernst zu nehmen und dann (u.a.) zu fragen, was eine durch Linux geprägte IT-Landschaft benötigt, um diese Anforderung so optimal wie möglich umzusetzen. Dabei ist natürlich mehr zu betrachten als nur der Desktop – jedoch in anderer Weise, als Herr Kleinert das tut. Ich komme darauf weiter unten zurück.

Es stimmt zwar – und da stimme ich Hrn. Kleinert zu :
Ein moderner Desktop allein stellt heute auch schon ein recht komplexes System dar – erst recht, wenn man seine Interaktion mit unterstützenden Server-Systemen in Betracht zieht.

Aber es gilt auch:
Die Einsetzbarkeit eines Desktops und dazu gehöriger Komponenten im täglichen Business bewerten zu können, liegt sicherlich nicht außerhalb des Beurteilungsvermögens der Anwender. Und ist nicht grundsätzlich gerade der Anwender selbst die letzte Instanz, die man im Zusammenhang mit Desktop-Funktionalität ernst nehmen sollte?

Ich finde es einfach kontraproduktiv, wenn Anwender, die sich in ihrer täglichen (mobilen) Arbeit nicht hinreichend durch die IT unterstützt fühlen und dies in ihrer amtlichen Funktion auch äußern, in der Linux-Presse nicht ernst genommen werden. So ist es zwar wohlfeil und einfach, Kritiker von LIMUX oder anderer Linux-Desktop-Varianten in eine bestimmte Ecke zu stellen – sinnvoller wäre es aber, zu recherchieren und sich offen damit auseinanderzusetzen, welche Resonanz denn der LIMUX-Desktop bei seinen ca. 15000 Anwendern wirklich erfahren hat und ob es nicht auch an der einen oder anderen Stelle berechtigte Kritik am Leistungsumfang geben mag. Davon könnte man dann vielleicht etwas lernen und der eigenen Augenwischerei gerade im Interesse von Linux ein Ende setzen. Und man muss das viel systematsicher angehen als der wohlgemeinte Versuch der PC-Welt (http://www.pcwelt.de/ratgeber/LiMux__Wohin_steuert_Linux_in_Muenchen_-Windows-Ersatz-8920737.htmls).

Nur weil die Stadt München sich vor langer Zeit aus sicher guten Gründen für einen Linux-Desktop entschieden hat, ist dies nicht mit einem Qualitätsurteil zu Linux gleichzusetzen. Zumal die Einsparung von Lizenzkosten und die Reduktion von Abhängigkeiten bei der Einführung sicher ebenso wichtige Motive waren wie eine hinreichende Anwenderfreundlichkeit.

Nebenbei: Typischerweise gehört die Gruppe der professionellen Linux-Desktop-User – wie Herr Kleinert – nicht zur Gruppe der Angestellten in der öffentlichen Verwaltung. Sonst wäre das LIMUX-Projekt ja gar nichts Außergewöhnliches. Es darf daher mit Fug und Recht bezweifelt werden, ob gerade Herr Kleinert die Anforderungen eines Bürgermeisters an eine Desktop- oder Laptop-Oberfläche (im Zusammenspiel mit Mobilität und anderen mobilen Devices) richtig einordnen kann.

Spekulationen statt Fakten zum LIMUX-Desktop

Ich hatte selbst Gelegenheit und in gewisser Weise auch das Privileg, täglich über mehrere Jahre mit dem Linux-Desktop der Landeshauptstadt München arbeiten zu dürfen. Ich hatte und habe allerdings keine Einsicht in Interna des LIMUX-Projektes und zugehörige Entscheidungen. Deswegen halte ich mich bzgl. einer Kommentierung des LIMUX-Projektes und des Rollouts der zugehörigen Systeme insgesamt explizit zurück. Auch die Entscheidung der
Verantwortlichen für eine bestimmte Desktop-Variante will und mag ich im Moment überhaupt nicht in Frage stellen.

Als erfahrener Linux-Anwender hatte ich selbst auch nie ernsthafte Probleme, mit dem Desktop im Rahmen der angebotenen Möglichkeiten zu arbeiten. Aber: Ich habe mich so manches Mal nach den Möglichkeiten meiner eigenen (frei-) beruflich und professionell genutzten Linux-Desktops und -Notebooks innerhalb der für sie spezifisch ausgelegten Netzwerk-, Server- und Groupware-Umgebung gesehnt. Und dabei musste ich beim LIMUX-Einsatz nicht mal mobil arbeitsfähig sein wie die jetzigen Bürgermeister.

Auf Details der angebotenen Lösung mag ich hier aus guten Gründen nicht eingehen. Bezeichnend finde ich allerdings für die gesamte Diskussion, dass bei den Linux-Befürwortern erst in letzter Zeit zum Leistungsvermögen von LIMUX spekuliert und recherchiert wurde:
https://debianforum.de/forum/viewtopic.php?f=15&t=150995 und dort den Beitrag von MrGerardCruiz oder
http://www.pcwelt.de/ratgeber/LiMux__Wohin_steuert_Linux_in_Muenchen_-Windows-Ersatz-8920737.html

Nehmen wir mal an, die in den oben genannten Links diskutierten Punkte würden zutreffen. Würde man eine integrierte Groupware-und Daten-Abgleich-Funktionalität, wie ich sie aus meinem eigenen Linux-Umfeld und anderen Installationen seit nunmehr einem Jahrzehnt von Lotus-, Open-Xchange, Zarafa oder auch Kolab-Lösungen in ganz praktischer Form kenne, nicht vermissen? Speziell an einem Verwaltungsarbeitsplatz? Hallo Hr. Kleinert, genau das kritisieren die Bürgermeister im Rahmen ihres technischen Verständnisses!
(Von Workflow-Vernetzung und der mobilen Nutzung von Kollaborationsdiensten unter Portallösungen wie Liferay will ich erst gar nicht reden …)

Dazu käme – soweit zutreffend sicher aus wohlüberlegten Gründen – ein Client, der schon 2009 in seiner Konfiguration gegenüber damals aktuellen “KDE 4”-Clients angestaubt wirken musste. Und was das Linux-Magazin nicht erwähnt: Ubuntu als neuer Unterbau würde dem Anwender nur begrenzt etwas nutzen, wenn man darauf z.B. eine eigene (Trinity-basierte) KDE-3.5-Oberfläche aufsetzte und – soweit die von der PC-Welt durchgeführten Interviews denn zuträfen – entsprechend veraltete Client-Software anböte.

Sicher, man kann sich als Linux-Anwender damit arrangieren – toll und überzeugend wäre eine solche Lösung aber noch lange nicht.

Aus meiner langjährigen eigenen Erfahrung mit dem manchmal schwierigen Update- und Upgrade-Management einer professionell genutzten Linux-KDE-Umgebung möchte ich allerdings auch Folgendes klar zum Ausdruck bringen:

An dem Vorhaben, eine eigene Linux-Desktop-Distribution für viele User auf Dauer zu managen, kann man sich in der Praxis die Zähne ausbeißen. Gerade weil das Innovationsmoment unter Linux so extrem hoch ist. Das Bedürfnis nach durchgehender Stabilität der Desktop-Umgebung UND ihrer vielfältigen Anwendungen sieht in einem großen Unternehmen mit tausenden von Standardarbeitsplätzen nun wirklich ganz anders aus als an privaten Linux-Arbeitsplätzen oder an Linux-Arbeitsplätzen für hochqualifizierte, flexible Entwickler und Linux-Fans.

Aus meiner Meinung, dass das Qualitätsmanagement unter Linux im Sinne einer Langzeit-Stabilität von Desktops und der von Hrn. Kleinert beschworenen “Funktionsstabilität” ihrer Anwendungen schlecht funktioniert und dass hier u.a. die Distributoren in der Rolle eines zwischengeschalteten QM-Managements völlig versagen, habe ich schon mehrfach keinen Hehl gemacht. [Auf der Server-Seite bietet sich mir dagegen ein viel positiveres Bild – im Fokus steht hier aber Desktop-Technologie].

Die Aufgabe, auf Dauer eine stabile Linux-Desktop-Umgebung bereitzustellen, würde aus meiner Sicht jedes größere
Unternehmen vor enorme Herausforderungen stellen. Insofern kann man den Schwierigkeitsgrad der Aufgabe, vor der die Verantwortlichen der Stadt München standen gar nicht überschätzen und Fundamentalkritik wäre völlig unangebracht. Vielmehr sollte sich die Linux-Community selbst mal fragen, was man für stabile Linux-Desktops in Großunternehmen und in der öffentlichen Verwaltung eigentlich an Qualitäts- und Stabilitätsmanagement aufbauen müsste. Obwohl gerade im KDE-Bereich in den letzten Jahren vieles sehr viel besser geworden ist, glaube ich dennoch, dass das Innovationsinteresse der Entwickler noch nicht hinreichend mit Stabilitätsinteressen der Anwender und vielleicht auch professioneller SW-Firmen, die gerne kommerzielle Anwendungen für einen Linux-Desktop entwicklen wollen, in Einklang gebracht wurde.

So gesehen, ist die Tatsache, dass der LIMUX-Desktop tatsächlich auf Tauende von Arbeitsplätzen ausgerollt werden konnte, eher eine hervorragende Leistung der Münchner IT-Verantwortlichen und Projekt-Manager.

Man sieht: Der Erfolg oder Mißerfolg eines Linux-Desktop-Projektes hängt vom angelegten Maßstab ab. Und genau da verläuft die Diskussion auch bei den Linux-Befürwortern jenseits einer sachlichen Grundlage.

Ein moderner Linux-Desktop muss sich selbstverständlich auch für einen Bürgermeister als Anwender mit besonderen Anforderungen bewähren

Trotz des formalen Abschlusses des LIMUX-Projektes gilt mit Sicherheit: Gerade ein Desktop muss sich im Alltag erst bewähren. Erst recht in der Welt der Verwaltung und den dortigen Ansprüchen an kontrollierte Arbeitsflüsse. Hierzu zählt in einer modernen arbeitsteiligen Welt übrigens auch die (von den Bürgermeistern kritisch gewürdigte) Austauschbarkeit der Arbeitsergebnisse mit den Anwendungen anderen Verwaltungen und nicht zuletzt auch mit den elektronischen Systemen der betrofenen oder interessierten Bürger.

So ist also auch ein Bürgermeister – egal welcher politischen Richtung – ein Anwender mit berechtigten Bedürfnissen. Aus Sicht der fachlichen und technischen Ansprüche (Mobilität, verschiedene Clients, Home Office, Sicherheitsbedürnisse) sogar ein hochinteressanter:

Als intern und extern vielfach geforderter, mobiler Mensch bedarf er in seiner Arbeit an PCs, Laptops, Smartphones, Tablet-PCs der technischen Unterstützung durch so schöne Dinge wie Web-Services, Portallösungen, Web-Clients für Groupware-Lösungen, VPNs etc.. Und wenn wir uns einige der Worte mal in ihrem technischen Gehalt ausmalen, dann entdecken wir etwas ganz Banales, aber für ein Desktop-Einführungsprojekt wie LIMUX etwas Grundlegendes, das im Zusammenhang mit der vorgebrachten Kritik von größerer Bedeutung sein könnte:

Die Einführung eines Desktops allein genügt für ein funktionierendes, modernes Linux/LIMUX-Environment in der Verwaltung womöglich gar nicht …. man braucht dann auch ein geeignetes Portfolio an anpassbaren Serverdiensten, eine hinreichend (segmentierbare) Netzwerk- und Infrastruktur sowie eine Vielzahl von Security Appliances, mit deren Hilfe man von außen und innen initiierte Interaktionen mit (Server-) Systemen in sicherer Weise abwickeln kann.

Aber wird dieser wichtige, vielleicht entscheidende Punkt im Editorial von Herrn Kleinert aufgegriffen? Nein! Dabei könnte man gerade an diesen Aspekt die Frage knüpfen, woran es denn wohl liegen mag, dass die Bürgermeister und andere Anwender nicht von mobilen Geräten aus einen hinreichenden Zugriff auf bestimmte Daten bekommen. Denn vielleicht liegt es ja gar nicht am Linux-Desktop – vielleicht liegt es an Sicherheitsfragen im Zusammenhang mit einer ggf. (z.Z. noch) unzureichenden Netzwerk-, Server- und vor allem (serverbasierten) Dienste-Infrastruktur? Vielleicht haben wir es mit einer Desktop-Einführung zu tun, zu der die weitere Infrastruktur erst noch nachgezogen werden muss? Aus welchen (vielleicht durchaus berechtigten) Gründen auch immer?
n
Möglicherweise ist ja ganz generell eine hinreichende serverbasierte Dienste-Landschaft eine notwendige Voraussetzung für die erfolgreiche Ablösung von Windows-Desktops und/oder zugehöriger Desktop-Anwendungen, die der Anwender in der Verwaltung benötigt? Vielleicht könnte man aus den Erfahrungen mit LIMUX wichtige Schlüsse für die Vorbereitung anderer Linux-Desktop-Projekte in ähnlicher Größenordnung ziehen?

Der technisch unbedarfte städtische Anwender des Linux/Limux-Desktops spürt ggf. nur : Mir fehlt was. Er sieht nicht unbedingt die Ursachen – aber seine Ansprüche sollten doch zumindest ernst genommen werden. Denn erst dann kann man sich sinnvoll auf die Suche nach den Ursachen der Defizite begeben und diese Ursachen auch bewerten. Der karikierende Verweis auf Außerirdische nutzt jedenfalls gar nichts und bringt weder die Linux-Kritiker noch Befürworter einen einzigen Schritt weiter.

Eine ausführliche Analyse der Anwender-Erfahrungen mit dem LIMUX-Desktop im Zusammenhang mit der der sonstigen Infrastruktur könnte dagegen im Interesse von Linux helfen, die Frage zu klären, was die erfolgreiche Einführung eines im modernen Büro-Alltag arbeitstauglichen Linux-Desktops eigentlich an Voraussetzungen in der Netzwerk- und Server-Umgebung sowie an Serverdiensten erfordert. Auch die Verwaltung der Stadt München könnte hier mit einer offenen Darstellung der Fakten zur Versachlichung und Verbesserung der Diskussion beitragen – und im Gegenzug Hilfestellung der Linux-Community (z.B. der OSB Alliance) bekommen. Aber dazu müssten alle Seiten die vorgebrachte Kritik ja erstmal ernst nehmen…

So muss man sich doch auch als Linux-Befürworter fragen, wieso es eigentlich erst Ende 2013/Anfang 2014 – also viele Jahre nach dem Beginn des LIMUX-Projektes – zu einer Entscheidung für eine einzuführende Groupware kam (http://www.linux-magazin.de/NEWS/Limux-und-Kolab-Auch-die-Muenchner-Groupware-wird-Open-Source, http://www.heise.de/ix/meldung/Muenchen-entscheidet-sich-fuer-Open-Source-Groupware-Kolab-2123512.html). Und erzähle mir bitte keiner, es ginge an einem modernen Verwaltungsarbeitsplatz unter Linux auch ohne Groupware und ein breites, gegliedertes und technisch abgesichertes Serviceangebot auch für mobile Clients …. Ja, es geht auch ohne. Aber wäre das eine zeitgemäße Lösung?

Eine faire Diskussion muss auch die umgebende Server- und Netzwerk-Infrastruktur einbeziehen

Der LIMUX-Rollout konzentrierte sich – meines beschränkten Wissens nach und sicher aus guten Gründen – auf einen managebaren Client. Aber damit Linux am Arbeitsplatz wirklich angenehm wird, bedarf es sicherlich noch ganz anderer, flankierender und massiver Maßnahmen im Server- und Infrastruktur-Bereich. Den Status solcher Zusatzmaßnahmen bei der Stadt München kennen wir alle nicht – aber man kann und darf sie im Sinne einer fairen und weiterführenden Bewertung einer Linux-Desktop-Einführung und der Kritik daran nicht ausblenden. Genau einen solchen Hinweis hätte ich u.a. vom renommierten Linux-Magazin erwartet.

Wie wichtig eine Betrachtung des Server-Umfeldes und der dort laufenden Services für die in der Kritik stehenden Desktop-Anwendungen ist, offenbarte auch für IT-Laien der vor kurzem aufgetretende Mail-Zwischenfall. Siehe:
http://www.golem.de/news/e-mail-ausfall-in-muenchen-und-wieder-wars-nicht-limux-1412-111129-3.html

Gewiss, man kann nicht alles auf einmal angehen – und Innovation bedarf des wohlabgewogenen Kompromisses. Da hat Herr Kleinert recht. Angebote für mobile Devices bringen zudem enorme Sicherheitsrisiken mit sich. Aber das
LIMUX-Projekt lief und läuft ja nun auch schon viele, ja inzwischen sehr viele Jahre. Und gerade deshalb darf man die aktuelle, späte Kritik betroffener Anwender – und seien es Bürgermeister – nicht vom Tisch wischen. Gerade als Linux-Befürworter! Oder man verpasst endgültig die vorhandenen Chancen für die Zukunft mit Linux an den Arbeitsplätzen einer sich ständig modernisierenden Verwaltung.

Dass hinreichende, solide und userfreundliche Lösungen für Verwaltungsarbeitsplätze unter Linux möglich sind, stelle ich am allerwenigsten in Zweifel. Ob die Kritik am LIMUX-Projekt berechtigt ist und wo ggf. die Ursachen liegen, muss man deshalb im Interesse von Linux und weiteren Desktop-Projekten sehr sorgfältig und unter Einbeziehung von IT-Prozessen, die über den Desktop hinausreichen, analysieren. Danach ist aufzuzeigen, wie man evtl. Defizite innerhalb der sicher hinreichenden Möglichkeiten von Linux systematisch beheben kann. In diesem Sinne waren die kritischen Beiträge der Bürgermeister zu LIMUX eher wertvoll – und keineswegs “außerirdisch”.

Ich bin jedenfalls gespannt auf das Ergebnis der in Auftrag gegebenen Analysen. Herr Kleinert hoffentlich auch ….