Lese-Ansicht

Deutsche Rechts-KI boomt

Das Berliner Startup Noxtua, gegründet 2017, das eine Software entwickelt, die mit Hilfe von KI juristische texte analysieren, Verträge prüfen und selbstständig Schriftsätze erstellen kann,…

  •  

Was man aus einer Umfrage nicht lernen kann

Viele unter euch kennen bestimmt den Spruch: „Traue nie einer Statistik, die du nicht selbst gefälscht hast.“

Mit Umfrageergebnissen verhält es sich ähnlich. Häufig werden Dinge in diese hineininterpretiert, welche durch die erfassten Daten gar nicht belegt werden können. In diesem Text möchte ich anhand eines einfachen Beispiels erläutern, was man aus einer Umfrage alles nicht ableiten bzw. lernen kann.

Wir unterscheiden zwei Arten von Umfragen

Umfrage ist nicht gleich Umfrage. Dies wird offensichtlich, wenn man sich der englischen Sprache bedient, in der zwischen Poll und Survey unterschieden wird. Ich habe Gemini um eine prägnante Erklärung der Unterschiede gebeten und folgende Antwort erhalten:

Der wesentliche Unterschied zwischen einer Poll und einer Survey liegt in ihrem Umfang und ihrer Komplexität.

  • Eine Poll (Meinungsumfrage oder Abstimmung) ist in der Regel eine schnelle, auf eine einzige Frage beschränkte Erhebung. Sie dient dazu, eine sofortige Meinung oder Präferenz zu einem spezifischen Thema zu erfassen, oft mit einfachen Multiple-Choice-Antworten.
  • Eine Survey (Befragung, Erhebung oder Umfrage) ist ein umfassenderer Prozess, der aus mehreren Fragen besteht und darauf abzielt, detailliertere Daten und tiefere Einblicke zu sammeln. Sie kann verschiedene Fragetypen enthalten, darunter offene Fragen, um qualitative Informationen zu erhalten.

In diesem Text betrachte ich eine Meinungsumfrage bzw. Abstimmung. Nach obiger Definition zeichnet sich daher schon ab, dass daraus kein großer Erkenntnisgewinn zu erwarten ist.

Umfrage auf Mastodon

Stand 28. August folgen mir auf Mastodon 249 Personen Accounts. Ob es sich dabei um natürliche Personen oder Bots handelt, weiß ich nicht sicher. Dies festzustellen, bedarf einer eigenen Analyse.

Am 20. August habe ich die in Abbildung 1 dargestellte Umfrage gestartet. Die Umfrage lief für die Dauer von einer Woche und ist mittlerweile beendet.

Abbildung 1: Screenshot einer Mastodon-Umfrage zur Verwendung verschiedener Container-Werkzeuge

Gewonnene Erkenntnisse

In Abb. 1 ist zu erkennen, dass 21 Personen abgestimmt haben, die Umfrage 5-mal geteilt und 3-mal favorisiert wurde. Laut dem Ergebnis benutzen von den 21 Personen:

  • 6 Personen (29 %) die nativen Podman-Befehle podman {run,start,stop} etc.
  • 9 Personen (43 %) verwenden Quadlets
  • 6 Personen (29 %) verwenden podman-compose

Das ist alles.

Der Erkenntnisgewinn ist tatsächlich recht gering. Aber mehr gibt diese kurze Umfrage einfach nicht her.

Was kann man hingegen nicht aus der Umfrage ableiten?

Einige Menschen neigen dazu, Dinge in Umfrageergebnisse hineinzuinterpretieren, die durch die Daten nicht belegt werden können. Dies passiert oftmals eher unterbewusst und völlig ohne böse Absicht. Um dem zu begegnen, hilft es, sich bewusst zu machen, was man alles nicht ableiten kann:

  • Ich habe keine Ahnung, wer an der Umfrage teilgenommen hat, da die Beantwortung anonym möglich war und ich keinerlei demographische Daten erhoben habe.
  • Da sich in sozialen Medien in der Regel Filterblasen bilden, liegt der Schluss nahe, dass die Antworten vorwiegend aus meiner Filterblase stammen und nicht repräsentativ sind.
  • Da die Umfrage mehrfach geteilt wurde, weiß ich nicht, ob nur direkte Follower oder auch indirekte Kontakte abgestimmt haben.
  • Ob Menschen die kein Podman nutzen, stattdessen Docker oder gar keine Container nutzen, weiß ich auch nicht.
  • Darüber wie viele Menschen in der IT nun Linux-Container betreiben und wie viele davon dies mit Podman tun, weiß ich nichts.
  • Diese Umfrage war sicher nicht repräsentativ.

Ziel der Umfrage – Was interessiert mich eigentlich?

Um ehrlich zu sein, habe ich mir zum Ziel der Umfrage gar nicht viele Gedanken gemacht. Ich habe sie spontan erstellt und wollte mich vom Ergebnis überraschen lassen. Während die Umfrage lief, kam in mir die Frage auf, was Menschen versuchen können, aus diesen Umfragen abzuleiten. Das führte zu diesem Artikel.

Grundsätzlich interessieren mich Antworten auf folgende Fragen:

  • Wie verbreitet werden Linux-Container in der IT eingesetzt?
  • Gibt es signifikante Unterschiede hinsichtlich ihrer Verwendung in Abhängigkeit der Branche?
  • Wie groß ist der Anteil von Docker, HELM, Kubernetes, OpenShift, Operator, Podman, Rancher und weiterer Werkzeuge?
  • Was sind die bevorzugten Werkzeuge?
  • Welche Werkzeuge werden für welchen Zweck bevorzugt genutzt?
  • Ist im zeitlichen Verlauf ein Trend zu erkennen?
  • Mit welchem Konfigurations-Format erreiche ich eine möglichst große Zielgruppe?
  • Wie stelle ich sicher, dass diese Daten unabhängig und repräsentativ erhoben wurden?

Besonders unter Berücksichtigung des letzten Stichpunktes wird deutlich, dass die Beantwortung dieser Fragen mit einer Menge Arbeit verbunden ist. Ich bin nicht so sehr an den Antworten interessiert, als dass ich bereit bin, diese Arbeit und Zeit zu ihrer Erledigung zu investieren.

Kann Künstliche Intelligenz hierbei helfen?

Das herauszufinden, wird Gegenstand eines kommenden Wochenendprojekts sein. Ich sehe dabei grundsätzlich folgende Herausforderungen auf mich zukommen.

Die diversen KI-Chatbots werden meine Fragen grundsätzlich mit einer starken Überzeugung beantworten. Einige listen dabei sogar die Quellen auf, welche sie für die Formulierung ihrer Antwort berücksichtigt haben. Daraus lässt sich dann immerhin ein Quellenverzeichnis erstellen. Die Arbeit liegt dann in der Quellenprüfung:

  • Was sind Primärquellen und Sekundärquellen?
  • Wie erfolgte die Datenerhebung?
  • Gibt es Interessenskonflikte? (z.B. hat der Gewinner eines Vergleichstest den Test bezahlt?)
  • Kann ich die Quellen prüfen oder liegen diese hinter Bezahl- bzw. Login-Schranken?

Ich habe noch Zweifel inwieweit mich die KI bei der Quellenprüfung unterstützen kann. Doch darum wird es in einem zukünftigen Artikel gehen. Hier ist nun für heute Schluss.

  •  

Fragen und Antworten zu meinem Blog

Immer wenn Dirk einen Beitrag außerhalb des regelmäßigen Linkdumps veröffentlicht, fällt mir dies auf. So bin ich auch auf seinen Artikel „Fragen zu meinem Blog“ aufmerksam geworden. Mit diesem nimmt Dirk an der Blogparade #blogfragen von Jansens Pott teil. Mir gefällt die Idee, weshalb auch ich gern diese Fragen für meinen Blog beantworten möchte.

Und los geht’s:

Warum hast Du ursprünglich mit dem Bloggen angefangen?

Das hatte und hat zwei Gründe:

Zum Einen habe ich gerne Blogs gelesen und wollte selbst mitmachen, um etwas zurückzugeben. Dies eröffnete mir auch die Chance zu lernen, wie man einen Blog bestehend aus CSS, HTML, PHP, Datenbank und Webserver betreibt.

Zum Anderen habe ich viel Zeit mit der Suche nach Lösungen für technische Probleme im Internet verbracht. Da ich ein schlechtes IT-Lösungsgedächtnis habe, musste ich einige Lösungen immer wieder suchen. Auch die Verwendung von Lesezeichen half nicht zuverlässig, denn teilweise waren die Seiten nicht mehr online. Also habe ich beschlossen, dieses Wissen in My-iT-Brain zu sichern.

Dabei habe ich gemerkt, dass ich Themen besser verstehe und im Gedächtnis behalte, wenn ich darüber schreibe. Diese Motivation treibt mich auch heute noch an.

Welche Plattform nutzt Du für Deinen Blog und warum hast Du Dich dafür entschieden?

Ich benutze von Beginn an WordPress. Es bietet mir alles Notwendige, um mich auf den Inhalt zu konzentrieren und nur wenig Zeit mit der Konfiguration der Plattform zu verbringen. Zu Beginn wollte ich WordPress lernen, um diese Plattform auch in Kundenprojekten nutzen zu können. Da die Plattform meinen Ansprüchen genügt, werde ich ihr auch weiterhin treu bleiben.

Hast Du schon auf anderen Plattformen gebloggt?

Ja.

Wie schreibst Du Deine Blogposts? Nutzt Du ein lokales Bearbeitungstool oder eine Panel/Dashboard-Funktion Deines Blogs?

Ich benutze hauptsächlich den in WordPress integrierten Editor. Wenn ich in einer Umgebung mit instabiler Internetverbindung unterwegs bin, schreibe ich die Texte in Vim.

Wann fühlst Du Dich am meisten inspiriert zu schreiben?

  1. Wenn ich mich mit einem Thema auseinandersetze oder gerade auseinandergesetzt habe.
  2. Wenn ich auf den Text einer Bloggerin oder eines Bloggers antworten möchte und die Antwort in meinen Augen den Umfang eines Kommentars sprengt.

Schreiben hilft mir, Dinge zu dokumentieren und zu reflektieren. Je weniger Dinge um meine Zeit für das Schreiben konkurrieren, desto leichter fällt es mir, Inspiration zu finden. Grundsätzlich kann ich zu jeder Tageszeit schreiben.

Veröffentlichst Du Deine Texte sofort oder lässt Du sie erst eine Weile als Entwurf liegen?

Wenn meine Artikel keinen direkten Bezug zum aktuellen Zeitgeschehen haben, versuche ich sie im Rhythmus von 14 Tagen zu veröffentlichen. Dies erzeugt eine gewisse Kontinuität. Stehen meine Artikel in einem zeitlichen Zusammenhang zu anderen Themen oder sind es Antworten/Kommentare auf andere Blogs, veröffentliche ich sie sofort.

Über welche Themen schreibst Du generell?

Da ich einen technischen Beruf habe und mir das Schreiben hilft, mich mit technischen Themen auseinanderzusetzen, schreibe ich vorwiegend über technische Themen.

Meine Karriere habe ich als Systemadministrator für Windows Client- und Server-Systeme begonnen, mich später mit Ubuntu sowie VMware vSphere beschäftigt und arbeite berufsbedingt aktuell viel mit dem Red Hat Portfolio. Schaut man auf die chronologisch sortierte Liste meiner veröffentlichten Beiträge, lässt sich diese Entwicklung nachvollziehen.

Für wen schreibst Du?

Primär schreibe ich für mich selbst, um Dinge, mit denen ich mich beschäftigt habe, nochmal nachlesen zu können. Wie der Name dieses Blogs andeutet, ist dies mein IT-Gehirn und soetwas wie eine Wissensdatenbank für mich.

In der Hoffnung, dass meine Themen und mein Geschreibsel auch für andere Menschen von Interesse sind, habe ich mich entschieden, mein Wissen und meine Gedanken öffentlich in einem Blog zu teilen.

Was ist Dein Lieblingsbeitrag auf Deinem Blog?

Es fällt mir schwer, mich für einen einzigen zu entscheiden. Aber wenn es wirklich nur einer sein darf, dann wähle ich: Überwachung von Temperatur und Luftfeuchtigkeit mit dem SHT21 von 2013.

Nicht nur, dass mir das Projekt seinerzeit viel Spaß gemacht hat, ich habe auch auf verschiedenen Wegen, vor allem aber per E-Mail, Rückmeldungen dazu erhalten. So habe ich erfahren, dass dieses kleine Projekt nicht nur in Serverräumen, sondern auch in Bienenbrutschränken zum Einsatz kam. In einer weiterentwickelten Form wurde in einer Fakultät bzw. einem Institut sogar die Durchflussmenge von verschiedenen Flüssigkeiten durch Rohrleitungen damit angenähert.

Ich glaube, ich muss mal bei einem ehemaligen Kollegen nachfragen, ob diese Lösung immer noch seinen Dienst im Serverraum verrichtet.

Hast Du schon Blogpausen eingelegt oder Blogs ganz aufgegeben?

Den Blog JnB-Tours, in dem ich unsere Urlaubsreisen und die dazugehörigen Fotos verbloggt habe, habe ich nach etwas über zwei Jahren aufgegeben und offline genommen.

Ich mag die Zeit im Urlaub lieber nutzen, um jeden Moment zu genießen und meine Umgebung zu erfahren, statt für einen Urlaubsreiseblog zu schreiben.

Was empfiehlst Du Menschen, die mit dem Bloggen anfangen wollen?

Traut euch und fangt an. Überlegt auf welcher Plattform ihr bloggen wollt, verzettelt euch aber nicht in langwierigen Plattform-Auswahl-Überlegungen. Je mehr ihr bloggt, desto mehr gewinnt ihr an Erfahrung und Routine.

Die Blogosphäre lebt nicht vom Zaudern, sondern vom Bloggen!

Hast Du Zukunftspläne für Deinen Blog? Vielleicht ein Redesign, ein Wechsel der Plattform oder neue Features?

Ich möchte den Blog in seiner bisherigen Form weiterführen. Dabei bleibe ich dem Theme Twenty Twelve treu.

Und nun seid ihr an der Reihe!

  •  

Umfrageportal graph.me

Statistiken und Umfragen sind immer wieder gerne gesehen, das hat man schon vor ein paar Jahren bei Statista gemerkt, welches 2008 zum Start-up des Jahres gekürt wurde. Einen ähnlichen Weg geht graph.me aus München. Diese junge Seite hat sich auf Umfragen und Trends spezialisiert, jedoch durch die Nutzer selbst und nicht nur zum Abrufen. Also ganz im Sinne des Social Web Trends. Das Design ist modern und zweisprachig verfügbar. Bestehende Umfragen sind nach Kategorien unterteilt oder können so gesucht werden. Außerdem können über das Startmenü die beliebtesten Umfragen abgerufen werden oder eine zufällige Auswahl, in dem man am Hebel neben dem Startmenü (was auch eine Einarmiger Bandit sein könnte) zieht.

graph.me

An Umfragen wie "Der schlechteste Billigflieger" oder "Wieviele Bücher liest du im Jahr" kann jeder teilnehmen, wer jedoch eine eigene Umfrage starten möchte, der muss sich zuerst registrieren oder einfach über Facebook Connect einloggen.

graphme umfrage

Sobald man seine Stimme abgegeben hat, kann man über Filter die Auswertung weiter verfeinern, sei es über das Geschlecht, Alter oder die PLZ.  Die Filterfunktion hat es mir hier sehr angetan, da sie eine gute Möglichkeit bietet genaue Einschränkungen bei der Auswahl vorzunehmen. Natürlich sind dabei die richtigen Angaben der Stimmengeber nötig. Der größte Nachteil der Seite ist momentan, dass man die Grafiken nicht extern verwenden kann und somit das eigene Blog außen vor bleibt. Auch wenn die Seite flott aussieht und durchaus Erfolg haben könnte, sollte sie sich dennoch bald nach Außen öffnen.

  •