br | exit

chart.aspx

einbruch des £ gegen den € morgens um 5. chart: finanzen.net

das brexit-referendum der briten endete letzte nacht um 22 uhr britischer zeit. anfangs sah es nach einer hauchdünnen mehrheit für den verbleib in der EU aus. das sieht man in der grafik ganz links – kaum ein kursverlust des pfund sterling gegen den euro. je mehr stimmen über nacht ausgezählt wurden, umso mehr sank der kurs. ein erstes tief (-4%) erreichte er kurz nach 3 uhr. als gegen 5 uhr die ergebnisse feststanden, fiel der kurs auf -7%. gegenüber dem amerikanischen dollar fiel das pfund auf ein 30jahres-tief. am vormittag kündigte permierminister david cameron seinen rücktritt an (der kurseinbruch bei 9.30 uhr), anschließend hielt der chef der britischen zentralbank eine nüchterne rede, die die stimmung beruhigen sollte (der anstieg auf -4,9%).

tracker | woher wir kommen, wohin wir…

eine tracking-software verfolgt unsere wege im internet nach, in der regel ohne uns persönlich zu kennen, in der regel, um der besuchten seite zu sagen: der/die person kommt von daher, und sie geht dahin. nichts besonders schlimmes also, aber man sollte es im auge behalten, und das tue ich mit ghostery, einem kostenlosen plug-in für firefox.

ghostery ist eine kommerzielle firma, deren einnahmequelle mir nicht ganz klar ist. jedenfalls fordert sie den nutzer auf, anonymisierte daten an ghostery zu schicken. das bedeutet, dort betreibt man eine art meta-tracking: statt, wie der normale tracker das tut, zu gucken, wer besucht meine seite und woher kommt er, liefert der nutzer ghostery daten ab, die besagen: soundsoviele sind von da und daher zu dieser seite gekommen.

mir als statistik-fan gefällt sowas, aber als datenschutzfan natürlich eher weniger.

trackerBeiFocusUndSüddeutscher

tracker: links focus, mitte süddeutsche, rechts süddeutsche

 jedenfalls war ich vorhin bisschen verwundert als mich eine google-suche zu einer seite von focus.de schickte und mir ghostery fette 18 tracker zeigte, die meinen weg verfolgen. (siehe linke liste oben.)

ich ging danach zur süddeutschen, um die zahl der tracker, die die SZ setzt, mit der von focus zu vergleichen: es waren nur 4 (mitte). dabei hatte ich aber übersehen, dass ich zu focus nicht direkt ging, sondern einem link folgte. zurück zu google, dort “nachrichten” aufrufen, dann die süddeutsche klicken führt zu den trackern rechts im bild: 17 an der zahl. mit anderen worten: es macht einen großen unterschied, ob ich einem link folge oder ein ziel direkt ansteuere.

sie reichen von der VG-Wort (die dies als nachweis braucht, wenn die seite texte bei der verwertungsgesellschaft gemeldet hat) über den burda-konzern bis zu google. google liefert, wie es aussieht, 3 tracker (adsense, tag manager, google+), aber doubleclick ist eine google-firma, damit sind’s 4. amazon, facebook, twitter und adobe (warum denn adobe?) sind auch vertreten. die anderen treten sich, wenn man sich ihre webseiten ansieht, gegenseitig auf die füße.

optimizely (san francisco) schreibt über sich selbst:

Jeder Besucher zählt /

Optimizely ist die #1 Plattform für Webseitenoptimierung weltweit

Eine einzige Optimierungsplattform für Webseiten und mobile Apps

und krux digital (san francisco):

Unlock Data From 1.6B Uniques

Krux is the only company offering a true cross-screen Data Management Platform (DMP) that captures data from any device – smartphones, tablets, desktops, laptops and connected TVs

yieldlab (hamburg; webseite heute nicht erreichbar):

Monetarisierung von Werbeplätzen

Wir sind der Spezialist für die Steigerung von Werbeeinnahmen in digitalen Kanälen.

was aber, wenn man in der suchmaschine einen link sieht und, statt ihn direkt anzuklicken, den link mit der rechten maustaste kopiert und dann in ein neues browserfenster einsetzt? angenommen, der link führt zu (gibt es nicht, frei erfunden:) humpelpumpel.com, dann hätte man früher den link humpelpumpel.com kopiert. heute kopierte man einen ganzen blumenstrauß, wo humpelpumpel mittendrin versteckt ist:

www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0CCwQFjAA&url=http%3A%2F%2Fwww.humpelpumpel.com%2F&ei=W_15VNnWPMG5OMPEgdAH&usg=AFQjCNErlf3Wsf54tUCCNlgqCgL8_6nAUw&bvm=bv.80642063,d.ZWU

auch das ist tracking-strategie. google lässt es sich nämlich heute nicht mehr aus der hand nehmen, jedem zu sagen: der kommt nicht einfach so zu dir, der kommt über mich, google zu dir! das hebt den preis.

um den trackern etwas weniger futter zu geben, muss man in den sauren apfel beißen und den link in google händisch eingeben. beispiel (siehe screenshot unten): wir suchen in google nach dem stichwort “zucker”. im moment wird da nach dem wikipedia-artikel als zweiter eintrag eine vermeintlich offizielle organisiation aufgeführt, nämlich das zentrum für gesundheit. (was für ein name für eine werbeagentur in der schweiz!) wollen wir diesem link folgen (ich wüsste nicht, warum), dann können wir auf ihn klicken, und google kreiert einen fetten link wie den oben. um das zu vermeiden, können wir aber im snippet-text die webadresse selbst markieren und kopieren. danach in die titelzeile des browsers eingesetzt, weiß das ziel (die firma in zürich) nicht, woher wir kommen, und google weiß nicht, wohin wir gingen.

diesenLinkKopierenstatt auf die große zeile zu klicken, den link darunter kopieren

eine visuellere form des trackings, die einem nämlich zeigt, wohin die besucher einer webseite gucken und klicken, habe ich vor längerem mal analysiert, und zwar → hier.

schweigespirale | elisabeth noelle-neumann

schweigespiraleschweigespirale und schere im kopf. grafik: m.s.

elisabeth noelle-neumann war die große frau der umfragen – und eine theoretikerin. auf sie geht der begriff der → schweigespirale zurück. in die schweigespirale gerieten die wähler des bundestags 1972 angeblich dadurch, dass die medienberichterstattung einen sieg der SPD propagierte. dadurch passierte folgendes: die wähler antworteten auf die frage, was sie wählen werden: etwa 50/50 SPD/CDU.CSU. auf die frage, wer die wahl gewinnen würde, verschwiegen viele ihre parteipräferenz und sagten immer häufiger, je näher der wahltag rückte, die SPD siegt. mit anderen worten: wer im biergarten antizipiert, dass seine meinung nicht willkommen ist, wird schweigen. [noelle-neumanns theorie ist umstritten, weil die statistik nicht ganz sauber war; aber die theorie gibt einem gefühl recht und hat sie deshalb lange überlebt.]

ich kam auf das thema durch eine → aktuelle statistik der amerikanischen demoskopie-firma pew research, die die offenheit untersuchte, mit der menschen ihre politischen ansicht zum edward snowden themenkomplex äußerten. die spezielle frage war die, ob sie es in sozialen netzen (facebook, twitter) wie im normalen zwischenmenschlichen bereich (zu hause, im café) tun? sie tun es nicht. 86 % der über 1000 befragten sagten aus, im freundeskreis würden sie über das überwachungsprogramm und snowden sprechen, aber nur 42 % täten es auch in sozialen netzen. das hat nur am rande mit der meinungsspirale zu tun und ist eher eine schere. jedenfalls, so schreibt pew research, hätten sich manche fans und betreiber sozialer netze erhofft, dass sich die menschen da sicherer fühlen als sie es tun. und natürlich hängt diese verschlossenheit wiederum mit dem thema der frage zusammen, eben der potenziellen überwachung, wie edward snowden sie aufgedeckt hat.

was kostet | ein kind?

drei US-statisiken fand ich aufschlussreich. die aktuellste, erst paar tage alt, berechnet die kosten, ein kind bis ins erwachsenenalter zu begleiten. sie liegen in einer typischen amerikanischen mittelstandsfamilie bei über $ 200.000, wobei die transportkosten (schulbusse, später führerschein und evt. eigenes auto etc.) deutlich höher sind als zum beispiel die ernährung.

Infographic: Raising a Child Today Could Cost a Quarter of a Million  | Statista

auch in den folgenden fällen ist statista meine quelle, wobei man wissen muss, dass die new yorker firma “nur” statistiken visualisert, wie im beispiel oben.

das pew research center stellte fast 50.000 personen in 44 ländern die frage, ob es akzepabel ist, dass die NSA die kommunikation von bürgern überwacht? 37 % der US-amerikaner halten das für vertretbar, gefolgt von indien und großbritannien. dann folgt ein sprung von 27 % auf 13 % für israel, 12 % für deutschland bis runter auf 4 % für brasilien.

schließlich die forbes-liste der reichsten US-amerikanischen familien 2014. die waltons sind die reichsten, ihnen gehört die ladenkette wal-mart. 152 milliarden dollar im familienbesitz. auf platz 3 ist die familie mars mit ihren gleichnamigen riegeln.

ich finde es schön, dass wenigsten die nach generationen der reichtumsvererbung immernoch heißen wie die produkte, die sie verkaufen.

die webauftritte | einiger rundfunkanstalten

alexa-webtraffic-ranking-für-einige-deutsche-hörfunksendermit alexa.com aufgestellter vergleich der zugriffe auf ARD-senderwebseiten

die von amazon vom archive.org-gründer aufgekaufte statistikmaschine alexa untersucht webverkehr und hilft bei der statistischen auswertung. ich gab heute mal die webseiten von sechs öffentlich-rechtlichen sendern ein. hier das ergebnis. der traffic rank besagt: je höher die kurve verläuft, desto mehr seitenzugriffe hat die domain. also: je kleiner die zahl, desto stärker die web-präsenz.

die statistik zeigt zweierlei: in den letzten sechs monaten hat sich wenig geändert. ausnahme ist der bayerische rundfunk (hellblau), der ende mai 2014 deutlich an popularität verlor. über die möglichen gründe weiß ich nichts. sieht man genauer hin, gibt es bei zwei sendern eine stetige, wenn auch leichte steigerung, nämlich beim mitteldeutschen rundfunk (dunkelgrün) deutschlandfunk/deutschlandradio (grasgrün).

das zweite, was man sieht, ist der erfolg der einzelnen senderportale im verhältnis zu anderen. es geht um die popularität der webauftritte, nicht die der programme; der deutschlandfunk hat hohe einschaltquoten, unter anderem weil er bundesweit sendet, aber er liegt bei dieser auswahl weit unten. spitzenreiter ist der norddeutsche rundfunk (lila), dicht gefolgt vom westdeutschen rundfunk (dunkelblau). südwestrundfunk und mitteldeutscher rundfunk haben fast identische webabrufe.

sehen wir uns die drei großen öffentlich-rechtlichen fernsehportale an, bewegen wir uns schon näher an die höheren ränge.

alexa - ard-zdf-tagesschautagesschau.de wird weit mehr angesurft als ard.de, aber kaum mehr als zdf.de

alexa hält auch das top-ranking nach ländern bereit. → topsites DE. in deutschland liegt ganz oben google.de, dann facebook, dann google.com, dann amazon, ebay, youtube und wikipedia. auf den plätzen 8 und 9 sind spiegel und bild; dann kommen die vier großen email-anbieter yahoo, gmx, web.de und t-online.

in großbritannien fängt die liste ähnlich an, auf platz 5 aber ist bereits die bbc. in deutschland ist der erste sender rtl, und zwar auf platz 43, kurz vor youporn (platz 46), kicker, zeit und zalando.

new york times | interne zahlen

in einem geleakten (oder sagen wir besser: nach außen gedrungenen) dokument aus dem intranet der new york times vom märz 2014 sind einige interessante fakten zu lesen. man kann ihnen trauen, weil die times da selbst gar nicht gut abschneidet. der “Full New York Times Innovation Report” zeigt zum beispiel eine (sicherlich nicht geheime, aber branchen-interne) statistik über die leserschaft:

newYorkTimes_internalStatistics_2014statistik der leserzahl von sechs zeitschriften in den USA

nach dieser aufstellung führt die huffington post seit anfang 2013, buzzfeed ist etwa auf einem niveau mit der times (rund 50 millionen leser). an der tiefroten kurve (eben die der new york times) ist auch bemerkenswert, das sie anfang 2013 etwa auf dem niveau von heute war, wobei es ein tief im august 2013 gab (40 millionen leser). außerdem ist die summe der leserschaft ingesamt seit einem jahr drastisch gestiegen. wenn man alle sechs kurvenwerte im april 2013 aufsummiert, kommt man auf etwa 240 millionen leser, im januar 2014 auf 310 millionen. das kann mehrere gründe haben. der naheliegendste wäre, dass mehr menschen zeitungen lesen, vor allem im internet. es kann aber auch bedeuten, dass den anderen publikationen die leserschaft wegbricht und wir hier nur die sechs großen player sehen, die entsprechend hinzugewinnen.

das interne papier beschreibt die aktuelle lage des internets als “cluttered”, also verzettelt/chaotisch, und die smartphonekultur als “distracted mobile world” (mobile welt der ewigen ablenkungen). zwei negative konnotationen also: “cluttered” und “distracted”. interessante ausgangsposition für die interne debatte, die dann damit weitergeht, dass angesichts dieses online-durcheinanders ein erfahrener nachrichtenredakteur sich nur um leser-acquise kümmern soll.

NYT_abos_2014zahl der leser der new york times über verschiedene verbreitungswege (2014)

auch diese (von mir visualisierten) zahlen sind interessant. sie betreffen nur die new york times. leider sehen wir hier keine zeitliche dynamik, sondern einen status quo von vermutlich anfang 2014. 30 millionen amerikaner (also mit US-IP-adressen) besuchen die webseite der times pro monat, 20 millionen tun es über die apps auf ihren tablet-computern und smartphones. die print-abos fallen dagegen ins marginale ab. ich schätze, sie waren vor einigen jahren viel viel mehr.

eine für die marketing-abteilung der zeitung besonders wichtige zahl ist die ganz oben: 760.000 abonnenten für die digitale new york times ist eine sicherlich wachsende, aber erstaunlich geringe zahl. sie besagt: nur 1,5 % aller leser der online-zeitung haben sie abonniert. mit diesem thema beschäftigen sich zurzeit alle printmedien. im grunde kämpfen sie damit, die kleine zahl nach oben zu bringen. die new york times macht das durch eine doppelstrategie: einerseits beschränkt sie die zahl der artikel, die man kostenlos online lesen kann (zurzeit auf 12 pro monat; es gibt tricks, darum herum zu kommen), andererseits lockt sie registrierte leser mit abonnements, die teilweise sehr preisgünstig sind. ich habe zurzeit eins, mit dem ich für drei monate $ 1 zahle. danach würde es viel mehr kosten, aber ich habe bereits gekündigt, sodass diese option nach drei monaten endet.

ich hielt vor einigen wochen auf dem dokumentarfestival in münchen einen vortrag über öffentlich-rechtliches senden und archive, worin auch das buhlen um hörer (und zuschauer) thema war. eine am rand gesetzte these möchte ich hier wiederholen: ein gutes programm wird von den hörern gefunden. man muss sich als radiomacher nicht anbiedern, wie die kommerziellen medien es tun müssen.

achso, der new york times-interne report ist → hier zu finden, also ausgerechnet beim onlinekonkurrenten buzzfeed. im →  wikipedia-artikel über buzzfeed sieht man die personelle verknüpfung zwischen buzzfeed und der online alles dominierenden huffington post.

wikipedia-streit | zum guten

computer_iPad_statistik_weltweitdie blaue linie besagt, dass weltweit seit 2004 der begriff “computer” immer weniger nachgefragt wird.

ich hatte aufgrund dieser statistik (blau: der suchterm “computer”, rot der suchterm “iPad”; näheres → einen eintrag zuvor) im wikipediaartikel über den computer eine stelle gesucht, wo ich die information hineinsetzen konnte. es gibt in dem artikel tatsächlich einen abschnitt, nämlich den, der sich mit den zukunftsaussichten für den computer beschäftigt. ich schrieb also hinein:

„Die weltweite Websuche nach dem Begriff „Computer“ nimmt seit Beginn der Statistik 2004 stetig ab. In den 10 Jahren bis 2014 war diese Zugriffszahl auf ein Drittel gefallen.“

als quelle – in der wikipedia heutzutage bei allen nicht-trivialen behauptungen unverzichtbar – nannte ich diese für jeden zugängliche statistik. 41 minuten später löschte ein anderer wikipediaautor (pseudonym “gut informiert“) diesen satz mit der begründung “spekulation” und verwies auf die diskussionsseite zu dem artikel. dort hatte er nämlich einen neuen abschnitt eröffnet, der innerhalb weniger stunden kräftig anwuchs. → hier ist er.

im prinzip schrieb “gut informiert”, dass es an brauchbarer sekundärliteratur fehle (stimmt). ich war mir dessen bewusst und hing nicht besonders an dem satz, war also nicht sauer über die löschung.

das schöne aber war, dass “gut informiert” drei statistiken lieferte, um die wackeligkeit der google-statistik zu zeigen. er befragte nämlich google books, also die hunderttausenden (millionen?) gescannter und textuell verschlagworteter bücher aus aller welt, nach der häufigkeit der worte “computer”, “ordinateur”, “rechner” in mehreren sprachräumen. hier seine zeilen dazu:


 Um zu zeigen, wie beliebig die Daten sind, betrachte man bitte die folgenden Diagramme.

[1] Das erste zeigt die Häufigkeit der Verwendung des Wortes “Computer” im englischen Bücherkorpus von Google Books, angetragen auf einem Zeitstrahl.

[2] Das zweite zeigt die Häufigkeit der Verwendung des Wortes “Computer” im deutschen Bücherkorpus. Die Häufigkeit des Wortes “Rechner” habe ich aus Synonymgründen ebenfalls darstellen lassen.

[3] Um die Sache abzurunden, folgt abschließend eine Suche im französischsprachigen Bücherkorpus nach den Wörtern “ordinateur” und “computer”.

Das Wort “Computer” zeigt in den Bücherkorpora, die bis 2008 reichen, unterschiedliche Trends auf. Im Englischen nimmt die Häufigkeit ab. Im Deutschen zeigt der Trend dagegen klar aufwärts (auch für “Rechner”). Im Französischen nimmt die Häufigkeit von “Computer” zwar ab, aber die Häufigkeit von “ordinateur” steigt seit Internetzeitalterbeginn wieder.


soweit diese wirklich erhellenden statistiken. ich gehe demnächst auf die google books-statistik-tools näher ein. unten schon mal als vorgeschmack die häufigkeit der worte “kant” und “hegel” in der deutschsprachigen literatur; keiner konnte mir bisher sagen, warum beide philosophen ausgerechnet um 1840 herum extrem häufig in der literatur auftauchten.

was die wikipedia-zusammenarbeit angeht: es ist völlig nebensächlich, dass ein anderer wikipedianer einige stunden später meinen satz wieder in den artikel zurückbaute. wichtig ist, dass man sich als autor nicht gleich beleidigt fühlt; gelingt mir auch nicht immer, hier aber schon. oft ist der ton zwischen autoren sehr rau.

kantHegel_1840die häufigkeit der namen kant und hegel in der deutschen literatur zwischen 1800 und 1900: was war 1840 los?

die wikipedia ist ein lebendiges ding, und einige sagen, das arbeiten an der wikipedia ist ihr soziales netz.

mäntel und ziegenkäse | statistische fingerübung

google trends sind ein verstecktes und damit häufig unterschätztes werkzeug zur analyse von web-anfragen. einen guten anfang kann man machen, indem man begriffe eingibt und sich deren popularität im laufe der zeit (eines jahres, einer woche, von 10 jahren etc.) anzeigen lässt. am besten formuliert man die schlüsselworte auf englisch und wählt dann aus den vorschlägen den passenden aus. bei stiefel = boot bietet google boot (garment), also bekleidung, an.

stiefelMantelSandaleTshirt_statistikgoogle-statistik zwischen sommer 2013 und sommer 2014: suchanfragenmenge für stiefel, mantel, sandalen, t-shirt

hier sieht man die häufigkeit, mit der die suchmaschine nach den worten stiefel, mantel, sandale und t-shirt befragt wurde, und zwar aufgezeichnet vom sommer 2013 bis heute. das ergebnis war wie zu erwarten: die nachfrage nach stiefeln (blau) und mänteln (rot) steigt im herbst an, bleibt über den winter hoch, mit einem peak im dezember (weihnachtsgeschäft), flacht dann direkt wieder ab. die sandalen (orange) haben wesentlich weniger web-anfragen und eine sehr harmonische kurve: sie sind nur im sommer beliebt, die t-shirts (grün) tendenziell auch, aber sie bleiben auch im winter stark, besonders zu weihnachten. die grafik ist interaktiv → hier zu finden (falls der browser google trends unterstützt; der chrome-browser tut’s natürlich — ein produkt von google).

unten eine ganz andere anfrage: ziegenkäse (blau) und hummus, also kichererbsenbrei (rot):

ziegenkäseHummus_statistikmenge der anfragen nach ziegenkäse und hummus: gegenläufige spitzen immer im dezember!

für beide suchbegriffe steigt die häufigkeit seit 2008 an. und sie zeigt eine besonderheit: wenn der ziegenkäse besonders stark nachgefragt wird, wird hummus weniger nachgefragt. und zwar passiert diese umkehrung immer im dezember. warum wohl? ich weiß es nicht. meine erste vermutung war, dass man den überbackenen ziegenkäse gern im winter als warme mahlzeit isst. aber – auch das zeigen die google trends – hummus wird vor allem in israel nachgefragt, wo es im winter nicht so kalt ist und wo ziegenkäse kaum eine rolle spielt. der spielt in den niederlanden die größte rolle. die grafik ist interaktiv → hier zu finden.

nun schränken wir die statistik auf suchanfragen aus deutschland ein und nehmen uns karl-theodor zu guttenberg vor, den aufgrund einer plagiierten doktorarbeit zurückgetretener verteidigungsminister. wenn man die statistik bemüht, sieht man einen singulären ausschlag im märz 2011:

karlTheodorZuGuttenberg_März2011_statistikder sturz des verteidigungsministers k. th. von guttenberg wird hier optisch deutlich.

guttenbergs sturz wird hier als stürzende linie deutlich. 100% interesse bestand anfang märz, nur noch 5% ende märz. man kann daraus ahnen, wann die plagiatsaffaire begann, wann guttenberg zurücktrat und wann er vergessen war.

im dargestellten zeitraum (juli 2010 bis dezember 2011) kamen die meisten suchanfragen übrigens aus den städten bayreuth (guttenberg kommt aus franken), gefolgt von bonn, kiel, nürnberg, göttingen.

als nächstes die statistik für plagiat, seit beginn der google-aufzeichnungen (2004) bis heute. sie korreliert mit der oben (willheißen: “guttenberg” ist fast synonym mit “plagiat”), aber sie flacht nicht so stark ab; es gibt nach der guttenberg-affaire ein eher welliges mittelgebirge:

plagiat_statistikhäufigkeit der googleanfragen aus deutschland nach dem begriff “plagiat” zwischen 2004 und 2014

nach dem massiven guttenberg-peak folgt anfang 2013 ein weiterer. schauen wir genauer hin: februar 2013. wer nicht mehr weiß, was damals war, kann z. b. die wikipedia nach dem februar 2013 befragen und wird dann auf ein interessantes ereignis am 5. februar stoßen.

um das interesse am begriff plagiat im amerikanischen suchbereich anzusehen, also wie stark sich amerikaner für plagiat interessieren, muss man den englischen begriff bemühen: “plagiarism”. da zeigt sich → eine kurve, in der die deutschen affairen keine rolle spielen. übrigens eine kurve, die ihre relativen minima immer im juli hat. vielleicht wegen des geringeren netzzugriffs in den sommerferien. es ist mit vielen begriffen so, mit vielen aber auch nicht.

die nachstehende kurve zeigt in blau die weltweite google-anfrage nach dem begriff “computer” und in rot nach “iPad”. ich glaube, sie spricht für sich selbst:

computer_iPad_statistik_weltweitweltweite google-suchanfrage nach “computer” (blau) und “iPad” von 2004 bis heute

die meisten anfragen nach “computer” kamen aus eritrea, gefolgt von tonga, guyana, swasiland, nigeria, bhutan und äthiopien. die meisten suchanfragen nach “iPad” kamen aus singapur, moskau, new york city, ho-chi-minh-stadt, bangkok, london und kuala lumpur. → hier als interaktive grafik (browserabhängig)

9 sender 1925 | und wer hört zu?

in der dissertation des studenten ernst klöcker an der universität erlangen im jahre 1926 über das funkwesen in deutschland und die wirtschaftliche bedeutung des rundfunks finde ich eine statistik über die zahl der offiziell registrierten, also gebühren-zahlenden rundfunkteilnehmer im jahr 1925.

rundfunkhörerstatistik_nach_klöcker_1926rundfunkteilnehmer, aufgeschlüsselt nach sendeanstalten, 1925. nach: klöcker 1926

ich wollte mir das grafisch ansehen, denn bekanntlich können wir menschen solchen tabellen nicht sofort besonders viel abgewinnen. also ging ich zu google docs, legte eine tabelle 11 mal 10 an und bat meine frau, mir die werte in der tabelle aus dem buch vorzulesen, während ich sie eintippte. stumpfsinnig, aber nach 5 minuten erledigt. man hat dann ein digitales schätzchen, nämlich eine vielseitig auswertbare tabelle. in etwas größerem rahmen mit natürlich anderen daten wäre das ein prima anwendungsfall für data mining, um aus großen datenmengen signifikanzen herauszulesen, die wir mit bloßem auge nicht sehen. jedenfalls…

… ist google docs etwas sperrig zu bedienen. wenn man sich aber erstmal eingelesen hat, kann man aus dieser zahlenmatrix mit wenigen mausklicks verschiedene visualisierungen erzeugen. ich legte für die wikipedia diese hier an:

Rundfunkteilnehmer_1925_nach_Sendern[bei klick wir die grafik größer.]

nach oben sind die registrierten hörer eingetragen, und zwar in verschiedenen farben, die den einzelnen sendern zugeordnet sind. nach rechts verläuft die zeit, von ende 1924 (da war der “unterhaltungsrundfunk”, wie er damals hieß, genau 1 jahr alt) bis september 1925. man sieht, dass berlin viele mehr hörer hatte als alle anderen; die hörerzahl stieg innerhalb des jahres von unter 200.000 auf über 300.000, flachte aber im sommer 1925 ab. die schwächere zunahme der hörerschaft ist auch bei allen anderen sendern zu verzeichnen, bei manchen, etwa frankfurt, hamburg oder königsberg in preussen, gingen die zahlen sogar leicht zurück. der autor des buchs hat seine zahlen vom reichspostministerium und kann nur mutmaßen, ob es an einer, wie er sich ausdrückt, “rundfunkmüdigkeit” liegt oder an schlechter empfangsqualität wegen zu schwacher sendeleistung. in der ersten euphorie meldeten sich viele interessierte an, merkten dann aber, dass der empfang nicht optimal war. münchens sender etwa hatte nur eine reichweite von 25 km, also etwa bis freising oder starnberg, und wurde 1926 durch einen 10 kilowatt-sender ersetzt, der viel weiter reichte und auch von älteren rundfunkgeräten empfangen werden konnte.

wegen der dominanz des berliner senders ist die grafik oben nicht gut zu gebrauchen, um die hörerzahlen der kleineren sender zu beurteilen. mit der tabelle in der rückhand kann man ohne aufwand beliebige parameter darstellen, zum beispiel nur die entwicklung der rundfunkteilnehmerzahl für münchen:

Rundfunkteilnehmer_1925_Münchenin der eingangsgrafik oben sind alle sender zu sehen, und wenn man genau hinsieht, schneiden sich einige kurven, was in der realität heißt: ein sender überholt einen anderen; leipzig überholt münchen, und, schwerer zu sehen, münster überholt stuttgart. wenn man die drei hörerärmsten sender auflistet, sieht man, wie stuttgart und münster sich umschlängeln:

Rundfunkteilnehmer_1925_nach_3_Sendernim summendiagramm können wir die gesamtzahl der rundfunkteilnehmer sehen (also etwa 800.000 im spätsommer 1925). wir sehen hier aber auch, dass berlin (der untere hellblaue bereich) fast so “dick” ist wie alle anderen zusammen. der sender berlin hatte mehr als ein drittel der hörer aller deutschen sender:

Rundfunkteilnehmer_1925_nach_Sendern_total

meine leser

keine ahnung, wer – außer den google- und yahoo-bots – die besucher dieses webtagebuchs sind. weil ich keine kommentare zulasse, bekomme ich nicht mal spams auf die “uhr”. wer unbedingt was loswerden will: → kontakt. warum dieses posting in eigener sache? weil heute fast 200 leute auf der seite waren. danke! unten auf der seite habe ich eine suchfunktion eingebaut. vor allem für mich ;-)

statifystatistik mithilfe des wordpress-plug-ins statify. april 2014. heute 189 aufrufe. reicht eigentlich .-)

ein gärtner und seine wikipedia-statistik

unter den einigen zigtausend regelmäßigen wikipediaautoren weltweit gibt es viele, die sich in bestimmten bereichen ganz besonders verdient gemacht haben. einen möchte ich hier vorstellen: er heißt henrik, lebt in schweden und nennt sich “gärtner der wikipedia”. zu henriks gartenarbeiten gehört, dass er ein kleines werkzeug programmiert hat, das seit langem standard bei der analyse von wikipedia-zugriffen ist. es gibt viele werkzeuge, die die wikipedia unter diversen gesichtspunkten analysieren. henriks “grok”-tool zeigt, wie oft ein wikipediaartikel in einem bestimmten zeitraum besucht wurde, englisch: article traffic statistics.

Sie finden dieses werkzeug hier: stats.grok.se. es erklärt sich quasi von selbst. hier drei beispiele. der deutsche wikipediaartikel über die bundeskanzlerin angela merkel wurde im letzten vierteljahr über 200.000 mal angeklickt. er ist in der rangliste der meist besuchten deutschen wikipediaartikel auf rang 997. (bei 1,6 millionen artikeln nicht schlecht)

wikiStatistik_merkel_de aufrufe des deutschen wikipediaartikels über angela merkel von november bis januar 2014

die grafik zeigt, dass der artikel täglich um die 800 mal aufgerufen wird, mit ausnahme von vier peaks seit november 2013. A: die große koalition unterzeichnete am 27. november 2013 den koalitionsvertrag. B: am 17. dezember wurde sie als kanzlerin der großen koalition vereidigt. C: am 6. januar verletzte sich merkel beim langlaufskifahren. D: am 25. januar betrat sie nach der winterpause den bundestag mit krücken.

die wikipedia gibt es in über 200 sprachen; sehen wir uns die statistik oben aus englischer sicht an:

wikiStatistik_merkel_en aufrufe des englischen wikipediaartikels über angela merkel von november bis januar 2014

kaum ein unterschied zur deutschen statistik. allerdings sind die zugriffszahlen ingesamt höher; der artikel wurde in den drei monaten fast 300.000 (deutsch: 200.000) mal aufgerufen, pro tag etwa 3.000 mal.

sehen wir uns zum schluss den artikel über den mordfall an meridith kercher an. ich hatte den artikel am 03.10.2011 um 23:42 uhr selbst angelegt, als der prozess in perugia erhebliches internationales interesse auf sich zog; ich wollte mit dem artikel nicht skandalisieren (dann hätte ich ihn auch nach der nun wiederholt verurteilten amanda knox benennen können), sondern dem leser eine neutral orientierung bieten, anhand gesicherter fakten. allein gestern wurde dieser von inzwischen etwa 60 autoren erweiterte artikel 40.000 mal aufgerufen, als das italienische gericht nach der revision einen neuen schuldspruch sprach:

wikiStatistik_kercher_de aufrufe des deutschen wikipediaartikels über den mordfall meridith kercher im januar 2014. herausvergrößert: die zugriffszahlen am 31.1.2014

man sieht hier auch, dass der artikel ansonsten kaum jemanden interessiert. probieren Sie das statistik-tool selbst aus: porsche wurde in der ukrainischen wikipedia im januar 500 mal aufgerufen; man muss dazu wissen, dass die ukrainische wikipedia ungleich kleiner ist als die deutsche und viel ukrainer die russische oder englische wikipedia konsultieren.

noch paar beliebige zahlen aus der deutschen wikipedia:

  • den artikel über den tagesthemen-moderator thomas roth sehen sich im schnitt knapp 10 menschen pro tag an,
  • den über den begriff der pseudomorphose aus der mineralogie etwa 20,
  • den über die jungfrau etwa 200,
  • und den über den drehimpuls etwa 400.