Data zijn een enorme drijvende kracht achter veel strategische veranderingen binnen moderne bedrijven. Met de groeiende beschikbaarheid en het overschot aan gegevens, wordt het voor bedrijven steeds gemakkelijker om te analyseren en wijzigingen aan te brengen op basis van inzichten die zijn afgeleid van de informatie die ze hebben verzameld. Dit concept, datagedreven besluitvorming, is niet nieuw. Bedrijven hebben deze praktijken in de loop der jaren op verschillende manieren gebruikt, of het nu gaat om het verzamelen van kwalitatieve gegevens over een nieuw product of het perfectioneren van de prestaties van hun verkoopteam. Ik hoop slechts een paar veelvoorkomende valkuilen te doorbreken waarmee bedrijven kunnen worden geconfronteerd bij het gebruik van gegevens voor besluitvorming.
Belangrijke vragen
Het verzamelen van gegevens kan een tijdrovend en vaak duur proces zijn. De goedkope kant van het spectrum is het verzamelen van interne gegevens, terwijl de duurdere kant het leiden van kwalitatieve focusgroepen is die draaien om een nieuw of bestaand product. Het medium waar ik me op zal concentreren voor het verzamelen van gegevens, valt grofweg tussen deze twee, enquêtes.
Bij het maken van enquêtes kunnen een aantal problemen ontstaan. Een van de meest prominente is het schrijven van vragen die tot een antwoord leiden. Dit kan opzettelijk of onopzettelijk worden gedaan, maar heeft daardoor een enorm potentieel om de resultaten van de enquête te vertekenen.
Hier is een goed voorbeeld van een leidende vraag in actie:
Hoe denkt u over de negatieve impact van ontbossing op het milieu?
Natuurlijk zijn er meerdere onderzoeken die de bewering ondersteunen dat ontbossing negatief is, maar als de implicatie dat ontbossing negatief is in de vraag, zullen responders vatbaar worden voor die gedachtegang. Dit zal ertoe leiden dat de meeste respondenten de vraag beantwoorden die al denkt dat ontbossing negatief is.
Voor een onbevooroordeelde reactie zouden deze twee vragen beter zijn:
-Welke impact heeft ontbossing op het milieu gehad?
- Hoe zou u de impact van ontbossing op het milieu beschrijven op een schaal van 1 tot en met 7, waarbij 1 zeer negatief en 7 zeer positief is?
Nu zijn deze twee vragen nog steeds niet perfect, maar de tweede vraag verwijdert het leidende karakter van de eerste vraag. Het kan helpen om een vraag in tweeën te delen om een volledige, onbevooroordeelde kijk op antwoorden te krijgen.
Gegevens zijn niet onfeilbaar
Ik kan dit punt niet genoeg benadrukken. Onderzoeksstudies hebben allemaal een door het bedrijf vastgestelde aanvaardbare foutenmarge, over het algemeen tussen 4% en 8% met een betrouwbaarheidsniveau van 95%. Dit betekent uiteindelijk dat de steekproef en resultaten uit het onderzoek niet perfect indicatief zijn voor de totale populatie. De kosten om een dergelijk resultaat te bereiken zouden astronomisch zijn. Dit wetende, is het belangrijk om te beseffen dat hoewel het gebruik van gegevens om zakelijke beslissingen te nemen een uitstekende manier is om risico's te verminderen, er nog steeds een risico zal zijn bij elke beslissing die wordt genomen. Dit brengt me bij een andere veelgemaakte fout bij deelname aan onderzoeksstudies en het analyseren van gegevens, vooringenomenheid.
Wees voorzichtig met vooringenomenheid
Ik zou een hele blog en meer kunnen besteden aan het concept van bias in onderzoek. Het kan in elk aspect van het onderzoeksproces voorkomen, van vroeg ontwerp tot analyse. Ik zou het in de eerste plaats willen hebben over de bias die kan bestaan in data-analyse. Een praktijk die bekend staat als data baggeren, kan zeer schadelijk zijn voor een bedrijf en een product en wordt vaak onbedoeld uitgevoerd door de onderzoeker en het bedrijf. Data baggeren, ruw gezegd, is het analyseren van gegevens door de gegevens zodanig te ontleden dat bepaalde relaties als statistisch significant kunnen worden weergegeven. Dit kan zeer schadelijk zijn omdat het een zeer hoog risico heeft om vals-positieven te vormen.
Een bedrijf, FiveThirtyEight, voerde een onderzoek uit waarbij ze een enquête uitzonden waaraan 54 mensen deelnamen. Vervolgens voerden ze ongeveer 27,716 regressies uit op die gegevens. Sommige resultaten waren hilarisch.
Hier zijn slechts een paar van de vele correlaties die ze statistisch significant vonden:
-Drinken limonade heeft een positieve correlatie tussen de overtuiging dat "Crash" het verdiende om de beste foto te winnen
-Het eten van schelpdieren is positief gecorreleerd met rechtshandig zijn
-Eten van tafelzout hangt positief samen met een positieve relatie met uw internetprovider
Het is duidelijk dat dit belachelijke correlaties zijn, maar wat nog belangrijker is om rekening mee te houden, is dat sommige hiervan echte correlaties kunnen zijn. Correlatie is echter niet hetzelfde als oorzakelijk verband. Met deze voorbeelden is het gemakkelijk op te merken dat er een probleem is met de analyse die op de gegevens is uitgevoerd. Het kan moeilijker zijn om dat probleem op te merken bij het analyseren van gegevens met betrekking tot uw bedrijf of een nieuw product waaraan uw bedrijf werkt.
Het is belangrijk om een stap terug te doen bij het beoordelen of analyseren van gegevens en te begrijpen wanneer er een vooroordeel, opzettelijk of onopzettelijk, kan bestaan en wees op uw hoede.
Gegevens zijn voordelig
Ik weet dat ik het grootste deel van deze blog heb gesproken over verschillende manieren waarop gegevens kunnen worden misbruikt of verkeerd worden begrepen, maar ik wil hieraan toevoegen dat gegevensanalyse over het algemeen een uitstekende ruggengraat is voor besluitvorming. Het kan het risico aanzienlijk helpen verminderen en kan werknemers beter informeren en productiever houden. Ik raad ten zeerste aan om gegevens te gebruiken om zakelijke beslissingen te nemen, maar het is ook belangrijk dat gegevens niet de enige doorslaggevende factor zijn.
Als je meer wilt lezen over de studie van FiveThirtyEight hierboven, gebruik dan de onderstaande link:
https://fivethirtyeight.com/features/you-cant-trust-what-you-read-about-nutrition/