Op 4 oktober ontving ik een e-mail van een verslaggever van de Wall Street Journal die mijn gedachten wilde over een studie over “bot-marketing van e-sigaretten” voor een verhaal dat hij van plan was.
Ik dacht dat dit ging over een recent rapport van het Britse bedrijf Astroscreen, dat Wired UK vertelde dat ze ontdekten dat er een “gecoördineerde, onauthentieke social media-campagne expliciet gericht op belangrijke Amerikaanse beleidsmakers was in een poging om hen te dwingen plannen voor anti-vaping wetgeving in te trekken.” Ironisch genoeg had Astroscreen een bot gebouwd om hun werk voor hen te doen, en omdat de bot “eigendoms machine learning technologie” is (vertaling: niemand behalve de auteurs kunnen zien hoe of waarom ze tot hun conclusies zijn gekomen), is er eigenlijk geen manier om de validiteit van hun conclusies te beoordelen.
Ik was voorbereid om dit te bespreken met de verslaggever die contact met me opnam. Maar hij nam contact met me op over de Astroscreen bot-studie.
De WSJ-verslaggever wilde opmerkingen over een ander rapport, van ongekende onderzoekers bij de Public Good Projects (PGP) en gefinancierd door iets dat de Nicholson Foundation wordt genoemd. Toen ik zei dat ik me ongemakkelijk voelde om commentaar te geven op een studie die ik nog niet had gezien of gelezen, bood de verslaggever aan me het rapport te sturen op voorwaarde dat ik het niet zou delen of erop zou reageren totdat het verhaal was gepubliceerd. Ik ging akkoord met die voorwaarden.
Laat me wijzen op hoe vreemd het is dat twee verschillende particuliere organisaties besloten om ogenschijnlijk wijdverspreide “bot”-activiteiten in de vaping-pleitbezorging aan te pakken door ongecorrigeerde “studies” te lekken naar grote nieuwsuitzendingen, kennelijk zonder enige plannen om die studies of peer-reviewed te krijgen en vóór enige openbare vrijgave.
Toen ik het PGP-rapport las, merkte ik andere overeenkomsten op. Net als Astroscreen was PGP onvergeeflijk ondoorzichtig over hun methodologieën. Volgens PGP biedt hun analyse “informatie die nog nooit eerder is gezien over de rol die bots momenteel spelen in online gesprekken rond e-sigaretten en tabaksproducten.” Specifiek concluderen ze dat “meer dan de helft van alle berichten die via openbare media-bronnen in de Verenigde Staten worden verzonden over e-sigaretten en tabaksproducten mogelijk zijn gepost door geautomatiseerde accounts, of bots.”
Toch bieden ze geen nuttige informatie over hoe ze tot zo’n conclusie zijn gekomen. Lezers moeten gewoon vertrouwen dat de bevinding geldig is. Maar ik merkte iets in het rapport op dat me goede reden gaf om het niet te vertrouwen. En, aangezien het artikel dat de Wall Street Journal uiteindelijk publiceerde geen van mijn opmerkingen aan de verslaggever bevatte, zal ik ze hier uitleggen.
Maar voordat ik daarop inga, laten we kijken naar enkele van de bredere problemen met het PGP-rapport.
Wat bedoelen ze met “bot”?
Allereerst is PGP onvergeeflijk vaag over wat ze eigenlijk hebben gedaan, hoe ze het hebben gedaan, en wat ze eigenlijk hebben gevonden. En dit maakt het erg moeilijk om uitspraken te interpreteren die in het rapport eenvoudig lijken, zoals deze: "uit een totaalmonster van 2.536.659 Twitter-berichten gerelateerd aan e-sigaretten of tabak, was 22,6% van de berichten gepost door mensen, 20,8% gepost door vermoedelijke bots, en 56,6% is bevestigd dat het door bots is gegenereerd."
Het is onmogelijk om de bovenstaande statistiek op een betekenisvolle manier te interpreteren omdat we niet weten wat PGP bedoelt met bots. Of beter gezegd, we weten niet wat ze als een bot hebben geteld toen ze de analyse deden. We weten wel, uit hoe het rapport is gepresenteerd, dat PGP wil dat we over bots in vaping denken als geautomatiseerde accounts, ontworpen om menselijk te lijken, die opereren om desinformatie over nicotine en e-sigaretten te verspreiden, en/of ze aan iedereen en iedereen, vooral kinderen, te adverteren.
Maar wat PGP wil dat we denken wanneer we “bot” horen is niet hetzelfde als wat ze daadwerkelijk als een bot hebben geteld in deze studie. Dus hoe heeft PGP eigenlijk bots geïdentificeerd, en wat beschouwden ze als een bot? Hier is wat ze in het rapport zeggen:
“PGP kan identificeren welke berichten een hoge waarschijnlijkheid hebben om van bots te komen en welke een hoge waarschijnlijkheid hebben om van mensen te komen…. PGP-onderzoekers bekijken meerdere accountkenmerken om de waarschijnlijkheid te bepalen dat een bericht van een bot komt, inclusief (maar niet beperkt tot) de frequentie en timing van berichten, het aantal berichten, het aantal volgers, en betrokkenheid bij andere accounts. Bots, vooral die gemaakt met kwaadaardige bedoelingen, zijn ongelooflijk genuanceerd en zijn vaak ontworpen om exact zoals een mens te lijken. Daarom is een eenvoudige inspectie van basisaccount- en profielkenmerken onvoldoende om de waarschijnlijkheid van automatisering te beoordelen.”
Dit is nutteloos. Het kan me niet schelen hoe accuraat PGP denkt dat hun methoden zijn; ik wil die evaluatie zelf maken, en dat kan ik niet op basis van de informatie die ze geven. Maar alles wat ze willen geven is dit patroniserende en overdreven vage excuus voor het niet vertellen van wat ze daadwerkelijk hebben onderzocht, zodat ik zelf kan beoordelen of hun studie valide is. Ze behandelen hun methoden als magie en kaderen ze als te geavanceerd voor hun lezers om te begrijpen, wat in wezen een enorme rode vlag is.
PGP deelde gisteren enkele post-hoc verduidelijkingen op Twitter over hun classificatieproces en methodologie die zelfs vaag en betekenisloos waren dan wat ze in het daadwerkelijke rapport zeiden. Bijvoorbeeld: “We definiëren “automatisering" als een score van 1-100. Een 100% robot zal dingen doen zoals auto-RT, zonder originele inhoud te posten.”
Peter Sterne, een freelance journalist die over de media-industrie schrijft, verwoordde het probleem met PGP’s bot-definitie kernachtig in een privébericht aan mij: “PGP heeft kennelijk een absurd brede definitie van bot (iedereen die een auto-posting-app gebruikt) aangenomen die veel echte mensen meeneemt, terwijl ze sterk impliceren dat alle “bots” onderdeel zijn van een geavanceerde sociale media-operatie en hun tweets niet voor lief kunnen worden genomen.”
Hoe dan ook, PGP was blijkbaar geïnteresseerd in het bestuderen van bots, hoe ze ook gedefinieerd zijn. De proportie bots die actief zijn in de vaping-ruimte, en de rol die ze kunnen spelen in pleitbezorging, is een legitiem onderzoeksprobleem, en ik denk dat veel vapers een studie die deze vragen zou kunnen beantwoorden, behoorlijk interessant zouden vinden. Maar het punt is, PGP heeft geen studie ontworpen die de vragen die hun rapport motiveerden zou kunnen beantwoorden.
Als PGP de kenmerken van accounts in een bepaalde populatie van tweeters (d.w.z., vapers) wilde begrijpen, zouden ze een manier moeten vinden om een representatieve steekproef van accounts uit die populatie te krijgen. Dit is praktisch onmogelijk, maar dat maakt niet uit omdat PGP niet eens lijkt te begrijpen dat ze iets als dit überhaupt zouden moeten doen. PGP heeft geen accounts bemonsterd, ze hebben tweets bemonsterd. Deze tweets werden verzonden door accounts (vanzelfsprekend), dus ze eindigden met een verzameling accounts, maar het was volledig ongepast voor de onderzoekers om door te gaan met het maken van inferenties over de populatie van accounts die over vaping tweeten op basis van enkele accounts waarvan de tweets toevallig in hun steekproef terechtkwamen.
Het andere grote probleem met het rapport is dat het eigenlijk niet zegt over hoeveel unieke accounts ze het hier hebben. Ze rapporteren cijfers van tweets (waarschijnlijk omdat die cijfers groter zijn, en PGP ons wil imponeren), maar we weten niet hoeveel accounts ze verzenden. En dit doet er eigenlijk veel toe als er echte bots in het sample zitten (en die zijn er waarschijnlijk wel) omdat een obscure spam-bot met nul volgers geprogrammeerd om honderden keren per dag over het vapen te tweeten een onevenredig aantal van de tweets in het hele sample zou kunnen hebben gegenereerd, zelfs als de bot weinig tot geen effect heeft buiten zijn kleine geïsoleerde bubbel.
Deze bots zijn helemaal geen bots
Het gebrek aan transparantie, ontbrekende definities en duidelijke methodologische incompetentie zijn reden genoeg om de conclusies van deze studie te betwijfelen. Maar de concrete indicator dat de bevindingen van PGP niet geldig zijn, is een sectie van het rapport die is verwijderd vóór de openbare release. (Je kunt de openbare versie op de website van PGP bekijken.)
Terug naar de Wall Street Journal. Toen ze me vroegen om commentaar te geven op het PGP-rapport, stuurden ze me een kopie. Het was 32 pagina's lang. Het resultaten gedeelte was 15 pagina's lang. En een subsectie binnen de resultaten, getiteld “Botnetwerken,” besloeg ongeveer 40 procent van deze resultaten. Het bestond uit vijf “micro-niveau” analyses van zogenaamde “botaccounts” en hun “botnetwerken geïdentificeerd tijdens [PGP’s] analyseproces.” Ze gebruiken grafieken om elk netwerk weer te geven. (Hier is de versie die ik van de reporter kreeg.)
Elk van PGP's grafieken was opgebouwd rond een focusnode, die een “bot” in de PGP-analyse vertegenwoordigde. Die node was gekoppeld aan andere nodes die accounts vertegenwoordigden die de tweet van de zogenaamde bot retweetten. Analisten van sociale netwerken verwijzen naar deze grafische representaties als “ego-netwerken,” omdat ze de relatie tussen een centrale node (de “ego”) en verbonden nodes (“alters”) afbeelden. PGP kleurcodeerde de alter-nodes op basis van of ze voldeden aan hun niet-gepubliceerde criteria om een bot te zijn, waarbij witte nodes accounts vertegenwoordigden die als mensen zijn bepaald. Witte nodes waren de minderheid van nodes in al PGP's netwerken.
PGP wil dat we geloven dat de overgrote meerderheid van de Twitter-activiteit over vapen waarschijnlijk niet is gegenereerd door echte mensen. Ze hebben de naam van de “ego” bot in het centrum van elk botnet weggelaten. Waarom? In het rapport beweren ze dat dit was om de privacy van de accounts te beschermen, maar als de accounts bots zijn, waarom zou dit dan belangrijk zijn?
Eerlijk gezegd, zelfs als PGP echt geïnteresseerd was in het beschermen van de identiteiten van botaccounts die verkleed gingen als echte mensen die zich bemoeien met online vapen-discours met potentieel ernstige gevolgen voor de volksgezondheid (of dat zeggen ze), het feit is dat ze een verschrikkelijke klus hebben geklaard.
Ik kon gemakkelijk de specifieke accounts identificeren die als de centrale node werden voorgesteld in elk van de vijf vermeende botnetwerken die PGP in hun originele rapport heeft opgenomen. Ik kon dit doen omdat PGP screenshots van tweets van de accounts had bijgevoegd die iedereen in de zoekbalk van de Twitter-gebruikersinterface kon typen en terughalen. Ik deed dat voor de tweets van elk account, controleerde hun volgers en aantal berichten met wat PGP rapporteerde, en verifieerde wie ze allemaal waren. Het hele proces nam minder dan een half uur in beslag. En raad eens? Geen van deze accounts zijn “bots die zich voordoen als echte mensen.”
Van de vijf accounts die PGP koos voor hun voorbeeldige discussie over botnetwerken was er slechts één die ik niet herkende. Het was een commercieel account in het VK, dat Twitter gebruikte om zijn eBay-lijsten voor verschillende producten, waaronder e-liquid en CBD, te adverteren. Leek het account automatisering te gebruiken om tweets te plaatsen? Ja. Was er enige aanwijzing dat er geen mensen achter deze tweets zaten? Nee. Zou een redelijk persoon dit voor iets anders dan een commercieel account van een online handelsbedrijf verwarren? Nee. Was er enige aanwijzing dat het account verder promootte dan zijn eigen volger netwerk? Nee.
Wat betreft de vier accounts waarmee ik bekend was, drie waren privé-accounts van individuen die al lange tijd pleiten voor vapen, en overduidelijk echte mensen. De andere was het Twitter-account voor deze publicatie. Vaping360 nieuwsredacteur Jim McDonald beheert en tweet vanuit dit account, en Jim is geen bot.
Dus van de vijf vermeende bots: één is het account voor een vapenpublicatie die wordt gerund door een van de journalisten die het gebruikt om artikelen te plaatsen, en in contact te komen met andere Twitteraars (dus hij plaatst originele content). Drie zijn privé-individuen die pleiten voor vapen. En de andere is een Britse retailer. Het is extreem moeilijk voor mij om te geloven dat iemand die bekend is met een van deze accounts zou concluderen dat ze bots zijn die zich als mensen voordoen. Of bedrijven die zich als individuele mensen voordoen. Of bedrijven die bots gebruiken om zich als individuele mensen voor te doen. Of iemand die betrokken is bij enige kwalijke activiteit, daarvoor.
En dit maakt de beslissing van PGP om de namen van deze vijf accounts te verdoezelen een beetje verdacht. Ten eerste wisten ze natuurlijk dat het mogelijk zou zijn voor iemand die wilde weten wie de accounts waren om dit uit te vinden met de informatie die ze beschikbaar hebben gesteld. Dus beschermden ze de privacy van niemand, ze maakten het gewoon iets arbeidsintensiever voor iemand die wilde weten wat de identiteit van de accounts was om die informatie te vinden.
De screenshots die ik kon gebruiken om tweets van deze accounts te zoeken, bevatten retweets en reacties op de accounts van “alters” die ook geen bots zijn - en er werden geen maatregelen genomen om de identiteiten van deze accounts te beschermen. De screenshots van PGP onthulden de namen en handles van andere accounts in de zogenaamde “botnetwerken,” alleen niet de centrale bots (die geen bots zijn).
Dit alles maakt het voor mij moeilijk te geloven dat het beschermen van de privacy van de “bots” de belangrijkste reden was dat PGP de account-ID's verstopte. Het slaat nergens op omdat de bescherming voor iedereen extreem gemakkelijk te ondermijnen was, omdat de bescherming niet werd uitgebreid tot de accounts die in screenshots verschijnen, en omdat PGP, aan het eind van de rit, een veel groter belang had om deze informatie te verbergen voor hun eigen bescherming en om de geloofwaardigheid van hun gebrekkige rapport te beschermen dan iets anders.
Privacy beschermen of gezicht redden?
Ik zou willen weten waarom PGP een andere versie van het rapport heeft gepubliceerd dan de versie die ze met de Wall Street Journal deelden. Blijkbaar deed Gregory Conley dat ook, die hen vroeg om verantwoording af te leggen voor deze keuze op Twitter. Het antwoord van PGP aan hem was dit:
“De WSJ had een exclusief recht op het onderzoek en we deelden informatie tijdens due diligence. Op een gegeven moment deelden we 5 accounts die hoge automatiseringsscores hadden, uit de 1 miljoen+ berichten die werden geanalyseerd. We wilden niet dat die accounts doelwit werden. Dus noch het artikel, noch het rapport vermeldt ze.”
PGP lijkt hier te impliceren dat de botnetwerken aan de Wall Street Journal zijn verstrekt als aanvullende context voor de finale studie. Als de analyse die ik als fataal gebrekkig heb gemarkeerd eigenlijk nooit bedoeld was voor publieke consumptie, en gewoon aanvullend materiaal was dat naar de Journal was gestuurd samen met het officiële rapport, verandert dat niets aan het feit dat het de geldigheid van de hele studie ondermijnt.
Maar het is behoorlijk moeilijk te geloven dat ze niet van plan waren om dit in de definitieve versie te hebben. De sectie stond vermeld in de inhoudsopgave van de versie van het rapport die naar mij was gestuurd. Dit was een kernonderdeel van hun resultatensectie, met de “botnets” als illustratief voor het abstracte fenomeen dat ze beweerden dat hun rapport belichtte. Er was geen aanwijzing dat deze inhoud niet bedoeld was als een belangrijk onderdeel van het definitieve rapport.
Ik kreeg de indruk dat wat ik kreeg de definitieve versie van het rapport was, en toen ik deze analyse als grofweg gebrekkig (en onethisch) aanstipte, werd me nooit verteld dat dit een oppervlakkig onderdeel van de studie was of speciaal voor de Wall Street Journal. Hoewel ik niet met zekerheid kan zeggen, leek de verslaggever die het naar mij stuurde de indruk te hebben dat dit ook de definitieve versie was. En echt, wie zou de werkversie van een baanbrekend rapport naar een krant sturen waarvoor je een exclusief aanbod doet? Dat is niet echt logisch. Het document dat de nu verwijderde botnetanalyse bevatte, was gepolijst, de verwijderde sectie maakte deel uit van de inhoudsopgave, niets geeft aan dat dit niet bedoeld was als het eindproduct.
Als PGP erachter kwam hoe slecht ze deze analyse hebben verprutst, zou dat hen moeten hebben doen twijfelen aan de geldigheid van hun gehele studie. Het verantwoordelijke, intellectueel eerlijke en transparante ding om hier te doen zou zijn om de krant te vragen hun verhaal vast te houden of te annuleren zodat het rapport kon worden gecorrigeerd, of misschien als de gebreken zo ernstig waren, te worden verlaten. Ten minste zou er een opmerking moeten zijn gemaakt waarin werd aangegeven dat de versie die naar de Journal was gestuurd anders was dan de definitieve versie die op de website werd gepubliceerd.
Ik denk dat PGP die pagina's heeft verwijderd zodra ze de voor de hand liggende ernst van de fouten die ze maakten begrepen. Ze hebben in alle andere opzichten de normale wetenschappelijke processen ondermijnd. Waarom zou ik—waarom zou iemand—geloven dat ze om iets anders gaven dan om hun gezicht te redden? Als PGP enige feitelijke concrete bewijs heeft om hun claim te ondersteunen dat de beslissing om deze sectie te schrappen niet gerelateerd was aan het feit dat hun botnets niet echt botnets waren, moeten ze daarmee naar voren komen.
Dehumanisering van legitieme demonstranten
Het rapport van PGP schetst een beeld van een geavanceerd netwerk van bots dat is ontworpen om mensen te misleiden door te geloven dat ze individuele mensen zijn om de discussie over vapen te manipuleren. Het feit dat geen van hun beste voorbeelden enige van de kenmerken van dit type account had (en vier van hen waren mensen die ik toevallig kende) roept serieuze vragen op over de betrouwbaarheid van de gehele onderneming.
De vapenadvocacy-sfeer op Twitter is een losjes verbonden gemeenschap van individuele burgers die hun grotendeels privé sociale media-accounts gebruiken in een specifieke context. Deze mensen zijn niet op Twitter voor het voordeel van opportunistische “publieke gezondheidsmonitoring en communicatiewetenschappers”, die iets te winnen hebben door hun door gebruikers gegenereerde inhoud te verzamelen en deze uit de context te presenteren om een wild ongeloofwaardige en intellectueel ongepaste theorie te illustreren dat invloedrijke vapenadvocaten niets meer zijn dan een geavanceerd netwerk van kwaadaardige bots, die bedrieglijk als mensen optreden om desinformatie te verspreiden in het belang van een of andere naamloze, gezichtloze, bedrijfsmacht.
Ik weet niet zeker of de schijnbare oneerlijkheid die het PGP-rapport doordrenkt, de poging van de organisatie vertegenwoordigt om het publiek te bedriegen, of meer reflecteert dat ze zichzelf hebben bedrogen.
Maar het maakt niet uit. Met of zonder de verwijderde “botnets”-sectie is het rapport van PGP volledig onethisch. Dit rapport ging niet over het bijdragen aan kennis over vapenadvocacy, het ging om het creëren van een mediastorm rond een schokkende bevinding die eigenlijk niet echt is. Het werd uitgevoerd door een privé, naamloze groep marktonderzoekers die ofwel de normen van transparant, geldig en betrouwbaar wetenschappelijk werk niet begrijpen of er niet om geven. Ze negeerden ook de zeer reële machtsonevenwichtigheid tussen de mensen die onderzoek doen naar vapen-tweeters, en de echte mensen die Twitter gebruiken om voor vapen te pleiten.
Het PGP-rapport is propaganda gericht op het dehumaniseren van legitieme demonstranten, het ondermijnen van hun zaak en het censureren van hun spraak op sociale mediaplatforms. Het rapport werd gepresenteerd met de schijn van wetenschap, maar het is volledig bedoeld om politieke doelen te dienen.
Voorgestelde verdere lectuur:
- The Association of Internet Researchers, Ethische besluitvorming
- Clive Bates, Memo aan publieke gezondheidsgrootheden: vapen, vapers en jij
- Jathan Sadowski, Bedrijven verdienen geld met onze persoonlijke gegevens – maar tegen welke prijs?

Vanwege de dalende sigarettverkoop bekijken staatsregeringen in de VS en landen over de hele wereld vaporproducten als een nieuwe bron van belastinginkomsten.
Een lijst van verbodsbepalingen voor smaken van vaping-producten en online verkoopverboden in de Verenigde Staten, en verkoop- en bezitverboden in andere landen.
Een nader kijkje bij PouchPoint, een online nicotine pouch winkel die concurrerende prijzen, een breed assortiment en een soepele winkelervaring biedt.
Een praktische, datagestuurde uiteenzetting van waar de vape-markt naartoe gaat—en hoe je jouw bedrijf kunt positioneren voorop de regelgevende en categorieverschuivingen.

















