BOKOMTALE

Programmering for humanister
Du trenger ikke være informatiker for å håndtere data og datasett. I alle fall ikke på et grunnleggende nivå. Men du trenger kanskje den nye heldigitale boken som har som ambisjon å lære selv oss humanister koding.

Læreboken "Databehandling og -analyse med Python og OpenRefine", som ble lansert i fjor høst, gir en innføring i databehandling- og analyse for humanister og samfunnsvitere. Boken fyller et behov i innen håndteringen av data i Norge – enten du jobber innen arkiv, bibliotek og museer, eller du trenger det innen utdanning eller forskning.
Enkel koding
Camilla Holm Soelseth, en av de tre forfatterne, forteller at boken gir leseren en opplæring i å kode i brukergrensesnittet Jupyter Notebooks. Med dette brukergrensesnittet kan man enkelt skrive kodesnutter i Python, se resultatet med en gang, og legge inn egne notater. Dette gjør det også til et særlig populært brukergrensnitt i digital humaniora, sier Holm Soelseth.
– Boken er laget for alle oss som har bakgrunn i fagområder innen humaniora og samfunnsvitenskap, og som nå jobber i en digital verden der materialer er digitale eller på vei til å bli digitalisert. For veldig mange vil dette bety at man jobber med data som har en tilknytning til en kulturinstitusjon. Det gjør dessuten at boka har en ekstra oppmerksomhet rettet mot nettopp arbeid med data fra norske kulturinstitusjoner.
Hun og de to andre forfatterne, David Massey og Michael Preminger, kommer fra Institutt for arkiv, bibliotek- og informasjonsbehandling på OsloMet. De to andre hadde jobbet med utformingen og konseptet i flere år, da hun i 2023 ble med for å lede prosjektet.
Boken tar for seg det mest grunnleggende. Det du trenger å vite og forstå for å kunne databehandle og gjøre data-analyser med programmeringsspråket Python og utvidelsen Pandas. Den går derfor ikke i dybden på ulike metoder og databehandlingspakker man kan ta i bruk for mer spesifikke analyser.
Digital, åpen og gratis
Boken er heldigital og åpent tilgjengelig for alle i en nettleser.
– Den enkleste måten å lære seg databehandling på er å jobbe aktivt med det. Derfor har boken integrert notebook-celler med kodesnutter man kan kopiere, samt datasett man kan laste ned og jobbe direkte med. Flere slike elementer er noe vi ønsker å innlemme i enda større grad i senere oppdateringer av boka.
Camilla forteller at boken vil komme i nye versjoner når det trengs for å speile de nye utgavene av programvaren. En styrke ved at boken er heldigital, er at dette kan gjøres på en enkel måte, og at boken dermed også hele tiden vil være relevant i forhold til den programvaren det gis opplæring i.
Call for Chapters
Boken slik den er nå gjør deg heller i stand til å kunne ta i bruk metodene for ditt spesifikke fagfelt. Men ulike fagfelt har ulikt fokus og ulike metoder de foretrekker, som igjen passer til ulike typer datamateriale. Forfatterne vet også at det mangler godt norsk læringsmateriell som gjennomgår disse metodene. For å bidra til dette vil de i løpet av våren sende ut en «Call for Chapters», «kapittelkall», der de inviterer andre til å bidra med kapitler som omtaler spesifikke metoder og databehandlingspakker.
Versjon 1.5, av boken vil også ha med et kapittel om innhøsting og bruk av API-er, og noen mindre oppdateringer for resten av boken, forteller Holm Soelseth.
– Vi inviterer alle til å prøve ut boken og gi oss tilbakemeldinger. Siden boken er heldigital, kan vi legge til kapitler som dekker nye områder og gjøre redigering basert på tilbakemeldinger.
God mottakelse
– Vi har fått veldig gode tilbakemeldinger fra både studenter og forskere. Faget «Innføring i databehandling og analyse» for bachelorstudenter på OsloMet ble gjennomført med dette som hovedpensum og ressurs. I de anonyme tilbakemeldingene var studentene veldig positive, og trakk fram det at det gjorde bruk av Python forståelig. Boken brukes også på masternivå av andre studenter, som siterer den i sine oppgaver.
Det er også mulig å invitere forfatterne til å holde en workshop med utgangspunkt i boken. I forbindelse med DHKO sin årskonferanse i oktober 2024 på NTNU holdt Camilla workshop for forskere som aldri hadde brukt programmeringsspråk.
– Nå, ett halvt år etter har jeg fått tilbakemelding fra en av de som deltok at hen nå utfører dataanalyser som del av sitt doktorgradsprosjekt som følge av denne workshopen.
Boken har også blitt sitert i en vitenskapelig artikkel i Journal of Open Humanities Data som et eksempel på et prosjekt som demokratiserer og tilgjengeliggjør muligheten for folk til å jobbe med «collections-as-data», eller samlinger i dataform, fra kulturinstitusjoner.
Camilla Holm Soelseth skal også kurs og workshops i å jobbe med databehandling og analyse ved bruk av Python for forskere ved OsloMet, slik at de kan jobbe med flere typer data, som for eksempel Nasjonalbibliotekets nylig lanserte webarkiv.