Analyse der letzten Buchstaben

Aufgabe 1

Lies alle 135 Jahrgänge in ein einzelnes DataFrame ein. Das DataFrame soll die Spalten Anzahl, Geschlecht, Name und Jahr haben. Folgende Codeschnipsel könnten dabei nützlich sein:

df['jahr'] = 2015

df = pd.concat([df1, df2, df3, ...])

for jahr in range(1880, 2015):

jahrgaenge = []

Aufgabe 2

Schreibe eine Funktion, die den letzten Buchstaben zurückgibt. Füge dem DataFrame eine neue Spalte mit dem letzten Buchstaben hinzu. Verwende dazu df.apply.

Aufgabe 3

Berechne die Summe der Vornamen nach Geschlecht, Anfangsbuchstabe und Jahr gruppiert. Die resultierende Tabelle sollte etwa so aussehen:

gender  last  year
F       a     1880    31446
              1881    31581
              1882    36536

Dieses DataFrame besitzt einen hierarchischen Index.

Aufgabe 4

Nun müssen wir den Anteil an den gesamten Vornamen eines Jahrgangs für Jungen berechnen. Leider sind die drei Befehle dazu durcheinandergekommen. Finde die korrekte Reihenfolge heraus:

df = df / df.sum()
df = df.unstack()
df = df.ix['M']

Hinweise:

Der Endbuchstabe a hatte im Jahr 1880 einen Anteil von 0.007023

Aufgabe 5

Wähle die Jahrgänge 1910 und 2010 aus. Zeichne ein Balkendiagramm mit je einer Balkengruppe für jeden Buchstaben, bestehend aus zwei Balken für die beiden Jahrgänge.

Aufgabe 6

Wähle die Endbuchstaben d, n und y aus. Zeichne ein Liniendiagramm, das die Häufigkeit dieser Buchstaben im zeitlichen Verlauf darstellt.

Aufgabe 7

Wie haben sich die Endbuchstaben im letzten Jahrhundert verändert?

Aufgabe 8

Ist ein ähnlicher Effekt für Mädchen zu beobachten?

results matching ""

    No results matching ""