Projekt Folketællinger/ konvertering fra DDD

Fra DS-Wiki
Version fra 18. dec 2012, 14:12 af Poul Wachmann (diskussion | bidrag) Poul Wachmann (diskussion | bidrag)
(forskel) ←Ældre version | Nuværende version (forskel) | Nyere version → (forskel)
Spring til navigation Spring til søgning
KILDEPORTALEN
Projekt Folketællinger
her: Projekt Folketællinger/ konvertering fra DDD

Søgning i folketællinger:

Kildebeskrivelse:

Information om projektet:

Download:

Kontakt:

Kategorier:


Denne artikel indeholder en vejledning til konvertering af folketællinger fra Dansk Demografisk Database, DDD, til Kildeportalen. Formålet med konverteringen er at sammenknytte data fra de allerede eksisterende indtastninger med billeder af kildematerialet. Disse billeder stammer primært fra Arkivalier Online. Denne sammenknytning med eksisterende indtastninger er en del af Projekt Folketællinger, som sammen med nye indtastninger vil give slægtsforskere langt bedre muligheder for at finde personer i folketællingerne. DIS-Danmark står som ansvarlig for projektet, der gennemføres i samarbejde med Statens Arkiver.

Data og programmer

De allerede indtastede folketællinger kopieres fra Dansk Data Arkivs DVD, DDD11 med senere rettelser. Rettelserne er tilgængelige her. Før data kan lægges ind på Kildeportalen er det nødvendigt at tilpasse filerne. Tilpasningerne foretages i et regneark. Ved udarbejdelsen af denne vejledning er der benyttet 2 gratis programmer:

  • Regneark: Open Office Calc
  • Browser: Google Chrome

De måske mere almindelige programmer som MS Internet Explorer© og MS Office (Excel)© kan formodentlig også benyttes, men de er ikke testet.

Konvertering af datafil

DDD11 er udsolgt fra Dansk Data Arkiv, DDA. En ny og opdateret DVD påregnes udgivet sidst på efteråret 2012. Når den bliver udgivet, vil vi anvende filer fra den nye DVD.

Gem filen og send den til kontaktpersonen for Projekt Folketællinger på Kildeportalen.

Kvalitetssikring

De nye felter, som er indsat i regnearket, styrer hvordan billeder og data er parret på Kildeportalen. Det er derfor vigtigt, at de indtastede værdier er korrekte. En senere fejlretning er både besværlig og tidsrøvende. En hurtig og enkel kontrol af de indtastede data kan udføres med funktionen Autofilter i Calc:

  • Marker et felt i titellinien i række 1
  • Vælg Data ⇒ Filter ⇒ Autofilter

Ved feltnavnene vises et rullefelt. Åbnes rullefeltet vises indholdet af alle felter sorteret, dog uden dubletter. Det er her overskueligt at checke både de nye og de normaliserede indtastninger.

Feltbeskrivelser

(A) KIP nummer

KIPnrcen_KIPnr. De indtastede data overføres uændret.

(B) Løbenummer

Løbenrcen_lbnr. De indtastede data overføres uændret.

(C) Kildestednavn

Kildestednavncen_kildestednavn. De indtastede data overføres uændret.

(D) Husstands-/ familienummer

Husstands/familienr.cen_husstand_famnr. De indtastede data overføres uændret.

(E) Matrikelnummer/ adresse

Matr.nr./Adressecen_matnr_adr. De indtastede data overføres uændret.

(F) Kildenavn

Kildenavncen_kildenavn. De indtastede data overføres uændret.

(G) Køn

Køncen_sex.
Normalisering (tilladte værdier)
M (mandkøn)
K (kvindekøn)
U (ukendt)
”” (tomt felt - ikke oplyst)

(H) Alder

Aldercen_alder.
Normalisering (tilladte værdier)
Positive heltal
"" (tomt felt)

Tekst som "under 1 Aar" erstattes af "0" (nul).

(I) Civilstand

Civilstandcen_civilstand.
Normalisering (tilladte værdier)
G (gift)
U (ugift)
E (enke eller enkemand)
S (separeret)
F (fraskilt)
X (ukendt)
Formel til konvertering
Formlen indsættes i række 2 i en ny kolonne og kopieres til de øvrige felter i den nye kolonne.
=HVIS(ELLER(I2="Enkemand";I2="Enke");"E";HVIS(I2="Gift";"G";HVIS(I2="Ugift";"U";HVIS(I2="Separeret";"S";HVIS(I2="Fraskilt";"F";"")))))

(J) Nummer ægteskab

Nr. ægteskabcen_num_mar. De indtastede data overføres uændret.

(K) Kildeerhverv

Kildeerhvervcen_kildeerhverv. De indtastede data overføres uændret.

(L) Kommentar

Kommentarcen_kommentar. De indtastede data overføres uændret.

(M) Stilling i husstanden

Stilling_i_husstandencen_stilling_i_hus. De indtastede data overføres uændret.

(N) Antal familier i husstanden

Antal familier/huscen_antal_fam. De indtastede data overføres uændret.

(O) Fødested

Kildefødestedcen_birthplace. De indtastede data overføres uændret.

(P) Trossamfund

Trossamfundcen_trossamfund. De indtastede data overføres uændret.

(Q) Handicap

Handicapscen_handicaps. De indtastede data overføres uændret.

(R) Midlertidigt opholdssted

Midlertidig opholdsstedcen_midlertidigt_opholdssted. De indtastede data overføres uændret.

(S) Hvornår flyttet til kommunen

Flyttet til kommunencen_flyttet_til_kommune. De indtastede data overføres uændret.

(T) Hvornår gift

Hvornår giftcen_gift_dato. De indtastede data overføres uændret.

(U) Antal levende børn

Antal levende børncen_levende_child. De indtastede data overføres uændret.

(V) Antal døde børn

Antal døde børncen_dead_child. De indtastede data overføres uændret.

(W) Boligtælling

Boligtællingcen_homecount. De indtastede data overføres uændret.

(X) Erhvervssted

Erhvervsstedcen_erhvervssted. De indtastede data overføres uændret.

(Y) Fødselsdato

Født kildedato ⇒ cen_borne_date.
Normalisering
YYYY-MM-DD.
Ufuldstændige datoer erstattes af 0000-00-00.

I FT er fødselsdatoen indtastet i forskellige formater. Konvertering til MySQL formatet kan i nogle tilfælde klares med en formel. Det er hensigtsmæssigt at konvertere datoerne til en ny søjle og efterfølgende at slette søjlen med de oprindelige datoer. Husk at fjerne formlerne før den oprindelige søjle slettes. Her er et par typiske eksempler:

Fast 2 cifre i dag og måned, f.eks. 01-04-1844
=SAMMENKÆDNING(HØJRE(Y2;4);"-";MIDT(Y2;4;2);"-";VENSTRE(Y2;2))
Eller på engelsk:
=CONCATENATE(RIGHT(Y2;4);"-";MID(Y2;4;2);"-";LEFT(Y2;2)) 
1 og 2 cifre i dag og måned med bindestreg, f.eks. 1-4-1844
=HØJRE(Y2;4)&"-"&HVIS((SØG("-";Y2)-SØG("-";Y2;4))=-3;MIDT(Y2;FIND("-";Y2)+1;2);"0"&MIDT(Y2;FIND("-";Y2)+1;1))&"-"&HVIS(SØG("-";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND("-";Y2)-FIND("-";Y2;4))=3;MID(Y2;FIND("-";Y2)+1;2);"0"&MID(Y2;FIND("-";Y2)+1;1))&"-"&IF(FIND("-";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))
1 og 2 cifre i dag og måned med punktummer, f.eks.1.4.1844
=HØJRE(Y2;4)&"-"&HVIS((SØG(".";Y2)-SØG(".";Y2;4))=-3;MIDT(Y2;FIND(".";Y2)+1;2);"0"&MIDT(Y2;FIND(".";Y2)+1;1))&"-"&HVIS(SØG(".";Y2)=3;VENSTRE(Y2;2);"0"&VENSTRE(Y2;1))
Eller på engelsk:
=RIGHT(Y2;4)&"-"&IF((FIND(".";Y2)-FIND(".";Y2;4))=3;MID(Y2;FIND(".";Y2)+1;2);"0"&MID(Y2;FIND(".";Y2)+1;1))&"-"&IF(FIND(".";Y2)=3;LEFT(Y2;2);"0"&LEFT(Y2;1))

Andre datoformater kan eventuelt konverteres ved at udskifte ”-” eller ”.” med ”/” og ” ” (mellemrum) i ovennævnte formler.

(Z) Fødselsår

Fødeårcen_born_year. De indtastede data overføres uændret.

Fødselsår benyttes sammen med fødselsdato til at danne den komplette fødselsdato YYYY.MM.DD i kolonne (Y) Fødselsdato.

(AA)) Sidste bopæl eller opholdssted

Sidste bopæl/oph.sted &rArr cen_last_living. De indtastede data overføres uændret.

(AB) Hvornår ægtefælle er død

Hvornår æf. dødcen_when_dead. De indtastede data overføres uændret.

(AC) Midlertidigt nærværende

Midlertidigt nærværendecen_tmp_present. De indtastede data overføres uændret.

(AD) Erhvervskommune

Erhvervskommunecen_erhvervskommune. De indtastede data overføres uændret.

(AE) Transportmiddel

Transportmiddelcen_transportmiddel. De indtastede data overføres uændret.

(AF) Adresse

Adressecen_adresse. De indtastede data overføres uændret.

(AG) Matrikel

Matrikelcen_martrikkel. De indtastede data overføres uændret.

(AH) Indkomst

Indkomst &rArr cen_indkomst. De indtastede data overføres uændret.

(AI) Formue

Formue &rArr cen_formue. De indtastede data overføres uændret.

(AJ) Statsskat

Statsskatcen_statsskat. De indtastede data overføres uændret.

(AK) Kommuneskat

Kommuneskatcen_kommuneskat. De indtastede data overføres uændret.

(AL) Statsborger

Statsborgerforholdcen_statsborgerskab. De indtastede data overføres uændret.

(AM) Bopæl 1924

Bopæl_1924cen_living_1924. De indtastede data overføres uændret.

(AN) Gadenummer

Gade nr.cen_gade_nr. De indtastede data overføres uændret.

(AO) Etage

Etagecen_etage. De indtastede data overføres uændret.

(AP) Forhus eller baghus

Forhus/Baghuscen_forhus_baghus. De indtastede data overføres uændret.

(AQ) Skemanummer

Skemanrcen_skemaer. De indtastede data overføres uændret.

(AR) Skemaets løbenummer

Skema lbnr.cen_skemalbnr. De indtastede data overføres uændret.

(AS) År for folketælling

FTårcen_FT_year. De indtastede data overføres uændret.

(AT) Kildehenvisning

Kildehenvisningcen_kildehenvisning. De indtastede data overføres uændret.

(AU) Kildekommentar

Kildekommentarcen_kildekom. De indtastede data overføres uændret.

(AV) Første medlem af familien

cen_first_in_fam
Normalisering (tilladte værdier)
1 (første medlem)
0 (øvrige medlemmer)

(AW) Billed-ID

cen_pic_id
Billed ID.jpg

Værdien til cen_pic_id findes i venstre side under billedet af det aktuelle opslag i folketællingen. NB: Værdien er kun synlig, når man er logget ind på Kildeportalen.

Eksempel
Opslaget i den viste folketælling har billed-ID 31991.

Under gennemgang af billederne og indtastning af billed-ID i regnearket sættes feltet 'Sideindhold'. For sider uden indtastede data sættes feltet til 'Ingen data'. I alle andre tilfælde bibeholdes 'Ukendt'. Under den efterfølgende upload af regnearket sættes feltet samtidig til 'Er færdig'.

(AX) Personens nummer på siden

cen_number_on_page

Nummereringen startes med 1 øverst på hver side i folketællingen og er fortløbende til sidste person på siden. Nummereringen benyttes til at bestemme rækkefølgen af de indtastede poster i skemaet under billedet på Kildeportalen.

(AY) Sognets ID

cen_sogn_id

Værdien af cen_sogn_id findes i URL til den aktuelle folketælling.

Sogn ID.jpg


Eksempel
Sognets ID er her 65 (Veksø)

(AZ) Herredets ID

cen_herred_id

Værdien af cen_herred _id findes i URL til den aktuelle folketælling.

Herred ID.jpg


Eksempel
Herredets ID er her 69 (Ølstykke Herred)

(BA) Amtets ID

cen_amt_id

Værdien af cen_amt_id findes i URL til den aktuelle folketælling.

Amt ID.jpg


Eksempel
ID er her 5 (Frederiksborg Amt)

(BB) Folketællingens ID

cen_ft_id

Værdien af cen_ft_id findes i URL til den aktuelle folketælling.

FT ID.jpg


Eksempel
ID er her 350 (FT-1901, Veksø Sogn)

(BC) Indtasterens ID

cen_indtaster

Værdien af cen_indtaster sættes til 5 (Dansk Demografisk Database).