Datasets

Dit onderzoek is gebaseerd op een verzameling van leenacties uit de database van Kiva.org. Deze gegevens zijn opgevraagd via een API (Application Programming Interface). Via deze API kunnen gegevens worden opgevraagd uit de database van Kiva.org. Met dit doel is een script geschreven voor de dataverzameling. Verdere scripts zijn geschreven om de variabelen uit het onderzoeksmodel te operationaliseren.

De longitudinale data zijn verzameld tussen 10 mei 2012 en 4 september 2012. Deze data bestaan uit alle leenacties die zijn gedaan in deze periode. In totaal zijn 1.217.627 leenacties opgeslagen. Voor elke leenactie zijn het identificatienummer, de datum en tijd, het leendoel (identificatienummer van de lening) en de leningverstrekker (identificatienummer van de leningverstrekker) opgeslagen. Voor 120.704 leenacties zijn de leningverstrekkers anoniem. Er zijn, op basis van de leenacties, 47.790 unieke leendoelen en 263.122 unieke leningverstrekkers opgeslagen. Vervolgens zijn aanvullende gegevens verzameld. Dit is gedaan met terugwerkende kracht, in de drie dagen na de eerste periode van dataverzameling. Hierbij zijn data voor de leendoelen en leenteamlidmaatschappen en leenteams vastgelegd. De data, die voor leendoelen verkregen kunnen worden, zijn om privacyredenen beperkt door Kiva. Het precieze leenbedrag van een leningverstrekker aan een leendoel is niet beschikbaar. Het streefbedrag van een leendoel, het gedeelte wat daarvan is geleend en het aantal leningverstrekkers dat dit totaal geleende bedrag geleend heeft, zijn in plaats van het precieze leenbedrag opgeslagen. Met deze gegevens is, per leendoel, de gemiddelde bijdrage berekend. Dit is gedaan door het geleende bedrag te delen door het aantal leningverstrekkers dat heeft geleend. Ook bij de vastlegging van leenteamlidmaatschappen geldt dat de gegevens, die met terugwerkende kracht kunnen worden verkregen, beperkt zijn. Verbroken leenteamlidmaatschappen zijn niet vastgelegd in de database van Kiva.org. Deze lidmaatschappen maken daarom geen deel uit van de dataset. Voor alle andere lidmaatschappen is vastgelegd op welke datum en tijd het lidmaatschap begon. De leningverstrekkers zijn samen van 120.620 unieke teams lid geworden. In de eerste periode van dataverzameling werden 14.783 leningverstrekkers lid van 20.070 (extra) teams. Elk leenteam, dat aan de orde kwam, is ook vastgelegd. Daarbij is het aantal teamleden opgeslagen. Tot slot zijn de teamleiders zijn als zodanig aangemerkt. Op basis van deze aanmerking kan onderscheid gemaakt worden tussen teamleiders en teamleden.

Download

Alle data zijn opgeslagen in een MySQL database. Ik heb al enkele andere onderzoekers voorzien van deze datasets (een PhD student HCI (Human–computer interaction) en ICTD (Information and Communication Technology for Development) aan de Universiteit van Michigan en een Economie studente aan de Universiteit van Nottingham). Gezien de populariteit zijn de MySQL exports van de tabellen hieronder op aanvraag te downloaden.

De datasets zijn ingepakt 19.3MB. In het .rar bestand (uit te pakken met WinRar) vind je de volgende SQL bestanden:

“Ruwe” data:

  • lending_actions.sql (65.5MB) – leenacties
  • lender.sql (10.5MB) – leningverstrekkers
  • loan.sql (2.36MB) – leendoelen
  • lending_team.sql (769KB) – teams
  • membership.sql (5.48MB) – lidmaatschappen

Geconstrueerde datasets:

  • setmaineffect.sql (37.5MB) – Dataset voor de toetsing van het hoofdeffect van teamlidmaatschap op leengedrag
  • setmodels.sql (9MB) – Dataset voor de toetsing van het leiderschapseffect op het leengedrag van teamleden (de MySQL rand() functie is toegepast op deze dataset om een selectie te creëren).

Downloadlink aanvragen

Klik hier en vul het aanvraagformulier in om de bestanden te downloaden.

Leave a Reply

Your email address will not be published. Required fields are marked *