
Regression von AFD Wahlergebnissen und Mindestlohnbeziehern in einem Kreis

Import der Daten

mindestlohn <- read_csv2("data/WSI_mindestlohn.csv")
wahlergebnisse <- read_csv2("data/Wahlergebnisse.csv")
Clean up the data

wahl <- wahlergebnisse %>%
     "kreis" = "...2", 
     "waehler" = "...5",
     "afd_stimmen" = "...57",
     "linke_stimmen" = "...59",
     "name" = "...3",
     "land" = "© Der Bundeswahlleiter, Wiesbaden 2022"
  ) %>%
    afd_prozent = as.numeric(afd_stimmen) / as.numeric(waehler),
    linke_prozent = as.numeric(linke_stimmen) / as.numeric(waehler),
    waehler = as.numeric(waehler),
    afd_stimmen = as.numeric(afd_stimmen),
    linke_stimmen = as.numeric(linke_stimmen)
    ) %>% # calculate afd percentage
  select(kreis, name, land, waehler, afd_stimmen, afd_prozent, linke_prozent) %>% 
  slice(6:nrow(.)) %>%#remove unused rows with metadata and total germany
#calculater for berlin as whole from east (11100) and west (11200) to 11000
wahl <- wahl %>%
    kreis = "11000",
    name = "Berlin",
    land = "BE",
    waehler = wahl$waehler[wahl$kreis == "11100"] + wahl$waehler[wahl$kreis == "11200"],
    afd_stimmen = wahl$afd_stimmen[wahl$kreis == "11100"] + wahl$afd_stimmen[wahl$kreis == "11200"],
    afd_prozent = (afd_stimmen / waehler)
  ) %>%
  filter(!kreis %in% c("11100", "11200")) #remove east and west berlin
lohn <- mindestlohn %>%
    "kreis" = "...1",
    "name" = "Region",
    "lohn_prozent" = "Anteil in Prozent der Beschäftigten mit Mindestlohn-anspruch"
  ) %>%
  select(kreis, name, lohn_prozent) %>%
  # select kreis with 4 or 5 digits
    nchar(kreis) == 4 | nchar(kreis) == 5
  ) %>%
  # add leading zero to kreis with 4 digits
    kreis = ifelse(
      nchar(kreis) == 4, 
      paste0("0", kreis), 

Show difference between the two datasets

wahl %>%
  filter(!kreis %in% lohn$kreis) %>%
  select(kreis, name) %>%

Hamburg is missing, get data from WSI website

lohn <- lohn %>%
  add_row(kreis = "02000", name = "Hamburg", lohn_prozent = 14.7) %>%
  add_row(kreis = "11000", name = "Berlin", lohn_prozent = 17.8)

Merge the two datasets

wahl_lohn <- wahl %>%
  left_join(lohn, by = "kreis") %>%
    lohn_prozent = lohn_prozent/100,
    name = name.x
    ) %>%
  select(kreis, name, land, afd_prozent, lohn_prozent, linke_prozent)

Regression in next file, save the data frame

saveRDS(wahl_lohn, "data/wahl_lohn.rds") #for leading zeros and reimporting