Sultihi ang HN: Ang mga kompanya sa YC nag-scrape sa kalihokan sa GitHub, nagpadala sa mga email sa spam sa mga tiggamit | Mewayz Blog Skip to main content
Hacker News

Sultihi ang HN: Ang mga kompanya sa YC nag-scrape sa kalihokan sa GitHub, nagpadala sa mga email sa spam sa mga tiggamit

Mga komento

16 min read Via news.ycombinator.com

Mewayz Team

Editorial Team

Hacker News

Sa Dihang Ang Imong Kalihokan sa GitHub Mahimong Sales Funnel sa Lain

Hunahunaa ang pagduso og commit sa alas-11 sa gabii, pag-ayo sa dili maayo nga authentication bug sa imong side project. Paglabay sa duha ka adlaw, naay email nga niabot sa imong inbox: "Uy, nakabantay ko nga nagtrabaho ka sa user auth para sa imong SaaS — makatabang ang among tool." Wala gyud ka nagpalista para sa ilang mailing list. Wala ka nakabisita sa ilang website. Wala nimo gihatag kanila ang imong email address. Bisan pa, nahibal-an nila kung unsa ang imong gitukod. Kanang makasamok nga pagbati? Dili kini paranoia. Kini usa ka sistematiko, industriyalisado nga operasyon sa pag-scrape nga naghimo sa imong open-source nga mga kontribusyon ngadto sa hilaw nga materyal para sa sukdanan sa pagtubo sa uban.

Usa ka bag-o nga thread sa Hacker News mitumaw kung unsa ang dugay nang gisuspetsahan sa daghang mga developer: usa ka subset sa mga kompanya nga gipaluyohan sa Y Combinator - ug daghang mga non-YC nga mga startup nga nagsunod sa parehas nga playbook - nga programmatically nga nag-ani sa datos sa kalihokan sa GitHub aron mailhan ug bugnaw-email developers. Ang backlash paspas ug mabangis. Para sa developer nga komunidad, kini molapas sa linya nga walay maalamong growth hack nga makalapas.

Sa Unsang Paagi Naglihok ang Scraping Machine

Ang publiko nga API sa GitHub, pinaagi sa disenyo, bukas. Gipagahom niini ang mga lehitimong panagsama, mga himan sa developer, ug analytics sa ekosistema. Apan ang parehas nga imprastraktura nga gitugotan ka nga magtukod usa ka dashboard sa CI / CD mahimong magamit pag-usab aron magtukod usa ka linya sa lead generation. Ang mga scraper ingest nag-commit og mga kasaysayan, repository nga mga hilisgutan, star counts, contributor list, ug — kritikal — ang mga email address nga developers usahay ibutyag sa ilang Git configuration o profile metadata.

Gikan didto, ang mga galamiton sa pagpauswag sa cross-reference gidumala sa GitHub batok sa mga profile sa LinkedIn, mga domain sa kompanya, ug mga database sa data broker. Sulod sa pipila ka minuto, ang usa ka hilaw nga GitHub username mausab ngadto sa usa ka bug-os nga contact record: kompanya, titulo, gipasabot nga tech stack, gibanabana nga gidak-on sa team. Ang ubang mga operasyon gikataho nga nagproseso sa libu-libo ka mga profile kada adlaw, nga direktang gipakaon ang mga resulta ngadto sa automated email sequence nga gitakuban isip personalized outreach.

Ang sopistikado sa operasyon mao ang naghimo niini nga labi ka invasive. Dili kini mga mass blasts sa gipalit nga mga listahan. Gipunting nila pag-ayo, nahibal-an sa konteksto nga mga email nga gihimo aron mabati nga ang nagpadala sa tinuud nakaila kanimo - tungod kay sa algorithm, sa usa ka haw-ang nga kahulugan nga gipadagan sa datos, ilang gibuhat. Ang teknikal nga pagkapamilyar nagmugna og sayop nga pagbati sa lehitimong relasyon diin walay anaa.

Nganong Ang mga Nag-develop Talagsaon nga Mabulnerable Niini nga Taktika

Kadaghanan sa mga propesyonal makakita sa usa ka bugnaw nga email kung unsa kini. Apan ang mga nag-develop nag-atubang sa usa ka piho nga sikolohikal nga lit-ag: ang mga pakisayran sa email tinuod, karon nga trabaho. Kung adunay usa nga naghisgot sa eksaktong repository nga imong giamot, ang piho nga balangkas nga imong gisagop sa miaging bulan, o ang sumbanan sa sayup nga nagpakita sa imong bag-o nga mga nahimo, kini nag-aghat sa usa ka "giunsa nila pagkahibalo niini?" tubag nga makalaktaw sa makadiyot sa spam filter sa imong utok.

Gidugangan kini sa kultura sa open-source development. Ang pagtampo sa publiko sa GitHub usa ka propesyonal nga praktis ug usa ka bili sa komunidad. Ang mga developers nagpaambit sa code sa dayag tungod kay ang transparency ug kolaborasyon maoy pundasyon sa ekosistema - dili isip usa ka imbitasyon nga i-prospect. Ang pagpahimulos niana nga pagkabukas alang sa komersiyal nga ganansya nga walay pagtugot maoy usa ka sukaranang pagbudhi sa kultura nga naghimo sa plataporma nga bililhon sa unang bahin.

"Ang problema dili kay ang mga startup gustong mangita sa ilang mga kustomer. Ang problema kay ilang gilibog ang 'makita sa publiko' sa 'libre nga magamit alang sa bisan unsang komersyal nga katuyoan.' Ang publiko nga datos ug consensual data dili parehas nga butang."

Adunay usab power asymmetry nga nagdula. Ang mga indibidwal nga developer walay makita kung kinsa ang nag-scrap sa ilang kalihokan o kung giunsa ang pagproseso sa ilang datos. Ang usa ka startup makahimo og 50,000 ka tawo nga listahan sa developer sa usa ka semana; ang mga developers sa maong listahan walay ideya nga kini anaa hangtud nga ang mga email magsugod sa pag-abot.

Ang Tinuod nga Gasto sa mga Startup nga Nagdula Niini nga Dula

Gikan sa puro mersenaryong panglantaw, ang estratehiya kay makapildi sa kaugalingon. Nagsulti ang mga komunidad sa developer. Ang mga thread sa Hacker News nahimong viral. Ang mga callout sa Twitter gibahin pag-usab. Kung ang imong taktika sa pagtubo mahimong usa ka pasidaan sa atubangan nga panid sa labing impluwensyal nga forum sa developer sa internet, ang kadaot sa reputasyon dili lang makaapekto sa usa ka kampanya - kini makadaot sa imong brand sa daghang mga tuig sa eksakto nga mamiminaw nga imong gipaningkamotan nga maabot.

Ang mga numero nagsulti sa usa ka makadaot nga istorya. Ang panukiduki sa industriya kanunay nga nagpakita sa bugnaw nga mga rate sa pagtubag sa email nga naglupad sa taliwala sa 1% ug 5% alang sa lehitimong outreach. Ang wala pangayoa nga mga email nga gitukod sa mga gikiskis nga datos mas grabe pa, nga kasagaran nagpahinabog mga reklamo sa spam nga makadaot sa reputasyon sa domain sa nagpadala ug makapamenos sa pagkahatod sa tanang sunod nga kampanya. Dili lang nimo gisunog ang mga tulay sa mga tawo nga imong gi-email — gipalisud nimo ang pagkontak ni bisan kinsa pinaagi sa email.

Hunahunaa ang kalainan: ang mga kompanya nga namuhunan sa tinuud nga pagpamaligya sa sulud, relasyon sa developer, ug pakiglambigit sa komunidad kanunay nga nagreport sa mga rate sa pagkakabig nga 3-5x nga mas taas kaysa sa katumbas nga gasto sa bugnaw nga outreach. Ang komunidad sa nag-develop, labi na, kusog nga misanong sa pagkakasaligan. Ang pag-sponsor sa usa ka open-source nga proyekto, pagsulat sa tinuod nga mapuslanong teknikal nga sulod, o pag-apil nga matinud-anon sa mga komunidad sama sa Hacker News ug Discord servers nagtukod sa matang sa pagsalig nga walay gikiskis nga listahan sa email ang makahimo.

Unsa Gayod ang Tanan sa Ethical Outreach

Ang kalainan tali sa invasive prospecting ug lehitimong outreach dili kanunay usa ka hayag nga linya, apan adunay klaro nga mga prinsipyo nga nagbulag sa duha. Ang etikal nga pag-angkon sa kustomer nagtahod sa mosunod nga mga utlanan:

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →
  • Consent-based contact: Gihatagan ka sa prospect og paagi aron maabot sila — pinaagi sa pag-signup sa newsletter, pagsulay sa produkto, pagrehistro sa panghitabo, o direkta nga pangutana.
  • Kalambigitan sa konteksto: Gitubag sa imong outreach ang usa ka problema nga klaro nga gipahayag sa prospek, dili usa nga imong nahibal-an pinaagi sa pag-monitor sa ilang kalihokan.
  • Transparent identity: Klaro ka kung kinsa ka ug giunsa nimo sila nakit-an. "Nakaplagan nako ang imong email pinaagi sa pag-scrape sa imong GitHub commits" dili pundasyon sa usa ka relasyon.
  • Dali nga pag-opt-out: Ang matag komunikasyon naglakip sa usa ka tinuod, praktikal nga paagi sa paghunong sa pagdawat og mga mensahe — wala gilubong sa 4-point nga font, wala nagtakuban isip link sa laing panid.
  • Pagminus sa datos: Gikolekta lang nimo ang imong gikinahanglan para sa lehitimong katuyoan nga anaa, dili tanan nga teknikal nimong ma-access.

Dili lang kini mga giya sa pamatasan — labi nga nagpakita kini sa mga kinahanglanon nga ligal. Ang GDPR sa Europe, CASL sa Canada, ug lain-laing mga balaod sa pagkapribado sa estado sa US nagpahamtang sa tinuod nga mga obligasyon sa pag-uyon ug lehitimong interes nga kanunay nga gilapas sa mga kampanya sa email sa scraped-data. Ang ligal nga pagkaladlad lamang kinahanglan maghatag ug paghunong sa pagtubo sa mga hacker, apan ang peligro sa reputasyon mahimong mas dali ug grabe.

Sa Unsang Paagi Ang Modernong mga Platform sa Negosyo Naghunahuna Pag-usab sa mga Relasyon sa Kustomer

Ang nagpahiping problema nga nagduso sa scrape-and-spam nga pamatasan usa ka guba nga modelo sa panghunahuna kung unsa ang relasyon sa kustomer. Kung ang pagkuha giisip nga usa ka dula nga numero — daghang mga kontak, daghang mga email, daghang mga "paghikap" - ang indibidwal nga tawo sa pikas tumoy sa email mawala. Mahimo silang usa ka laray sa usa ka spreadsheet, usa ka posibilidad sa pagkakabig, usa ka variable sa eksperimento.

Ang mga plataporma nga gitukod sa lahi nga pilosopiya nagsugod gikan sa kaatbang nga premise: nga ang kalidad sa usa ka relasyon sa kustomer mao ang asset, dili ang gidak-on sa usa ka listahan sa kontak. Nagpasabot kini sa pagpamuhunan sa mga himan nga makatabang sa mga negosyo nga masabtan ang mga kostumer nga naa na nila, makiglambigit kanila nga makahuluganon, ug magtukod sa matang sa produkto ug komunidad nga makamugna og tinuod nga inbound nga interes.

Ang Mewayz, pananglitan, miduol sa CRM dili isip usa ka makina sa pagpangita apan isip usa ka hiniusa nga sistema alang sa pagdumala sa tinuod nga mga relasyon sa matag yugto sa panaw sa kustomer. Uban sa mga module nga naglangkob sa CRM, pag-invoice, HR, analytics, ug uban pa - ang tanan nagserbisyo sa kapin sa 138,000 nga mga tiggamit sa tibuuk kalibutan - ang plataporma gidisenyo sa palibot sa kamatuoran nga ang mga negosyo nagmalampuson pinaagi sa pagpalalom sa pakiglambigit sa ilang naglungtad nga base sa kostumer, dili pinaagi sa pagbuto sa bugnaw nga mga email sa mga scraped nga lista. Kung ang imong CRM, mga himan sa komunikasyon, ug analytics nagpuyo sa parehas nga modular nga ekosistema, nagtrabaho ka sa daghang signal nga datos gikan sa mga tawo nga mipili nga makig-uban kanimo — labi ka labi ka bililhon kaysa bisan unsang na-scrap nga dataset.

Pagprotekta sa Imong Kaugalingon isip usa ka Developer

Samtang ang responsibilidad alang sa etikal nga pamatasan naa sa mga kompanya nga naghimo sa pag-scrap, ang mga developer makahimo og praktikal nga mga lakang aron makunhuran ang ilang pagkaladlad:

  1. I-audit ang imong profile sa GitHub: Kuhaa ang imong personal nga email address gikan sa imong publikong profile ug gamita ang usa ka address sa papel (sama sa [email protected]) kung gusto nimo nga makontak.
  2. I-configure pag-ayo ang imong Git nga kliyente: Siguroha nga ang imong global user.email dili ang imong pangunang personal nga adres kon ikaw mopasalig sa publikong mga tipiganan.
  3. Gamita ang mga setting sa pagkapribado sa email sa GitHub: Ang GitHub nagtanyag og opsyon nga "Itago ang akong mga email address nga pribado" nga mopuli ug noreply nga adres sa mga operasyon nga nakabase sa web.
  4. I-report ug i-block ang agresibo: Kung makadawat ka og mga email nga klaro nga gitukod sa gikiskis nga datos sa kalihokan, markahan kini nga spam ug i-report sila. Ang igo nga mga taho makaapekto sa reputasyon sa nagpadala sa lebel sa imprastraktura.
  5. Ngalan ug kaulaw nga mahunahunaon: Ang Hacker News nga hilo nga nakapukaw niini nga panag-istoryahanay usa ka hingpit nga panig-ingnan sa responsibilidad sa komunidad sa aksyon. Ang publikong dokumentasyon sa abusadong mga buhat nagmugna ug tinuod nga mga sangputanan.

Wala niining mga lakang ang perpekto. Ang usa ka determinado nga scraper nga adunay access sa paghimo sa metadata ug cross-referencing nga mga himan kanunay nga makit-an ang impormasyon sa pagkontak bisan kung wala kini direkta nga gibutyag. Apan hinungdanon ang panagbingkil — ang pagpalisud sa pag-ani sa imong datos makapakunhod sa ROI sa operasyon sa pag-scrape ug magduso sa mga operator ngadto sa dili kaayo invasive nga mga pamaagi.

Ang Taas nga Dula: Pagsalig isip Competitive Bentaha

Adunay mas lapad nga pagtulon-an sa negosyo nga nalakip niining kontrobersiya nga labaw sa spam nga gipunting sa developer. Nagkinabuhi kami sa usa ka yugto sa lawom nga pag-recalibrate kung giunsa ang mga kompanya nagtukod mga relasyon sa kustomer. Ang napulo ka tuig nga playbook sa pagtubo-sa-tanan-mga-gasto, nga gipasiugdahan sa barato nga datos ug barato nga pagtagad, nagdagan ngadto sa lisud nga mga limitasyon: regulatory pressure, mga pagdili sa plataporma, nagkataas nga customer sophistication, ug — tingali ang labing importante — ang lebel sa komunidad nga pagsukol gikan sa eksakto nga mga startup sa audience nga gustong maabot.

Ang mga kompanya nga modaog sa sunod nga dekada dili ang adunay labing agresibo nga operasyon sa pagpangita. Sila ang nakasabut nga ang pagsalig managsama. Ang usa ka developer nga nakadiskubre sa imong produkto sa organikong paagi, nakakaplag niini nga tinuod nga mapuslanon, ug nagrekomendar niini sa ilang team nagkantidad ug usa ka gatos nga na-scrap nga mga email address. Ang reputasyon sa pagrespeto sa pagkapribado sa developer usa ka lig-on nga kompetisyon nga asset sa usa ka merkado diin kana nga pagtahod labi ka talagsaon.

Ang Hacker News nga thread bahin sa GitHub scraping mahanaw. Ang mga email magpadayon sa pag-abut sa makadiyot - ang mga batasan mamatay nga lisud ug ang tooling dali ra ma-access aron ang praktis mawala sa tibuok gabii. Apan ang nagpahiping dinamika nagbag-o. Ang mga komunidad nagtagad. Ang mga regulator nag-amping. Ug ang mga developer nga gi-spam nagtukod sa sunod nga henerasyon sa mga himan, platform, ug mga produkto. Ang pagpahilayo kanila sa pipila ka porsyento nga punto sa open rate dili usa ka patigayon nga angay buhaton.

Ang kaugmaon iya sa mga negosyo nga nakakuha og atensyon imbes nga anihon — nga nagtukod og mga produkto nga tinuod nga mapuslanon, lawom kaayo nga gisagol sa kung giunsa ang pagtrabaho sa mga tawo, nga ang mga kustomer nangita alang kanila. Dili kana usa ka walay pulos nga pangandoy. Kini na lang ang malungtarong estratehiya nga nahabilin.

Mga Pangutana nga Kanunayng Gipangutana

Giunsa kini nga mga kompanya makakuha sa akong email address gikan sa kalihokan sa GitHub?

Kadaghanan sa mga profile sa GitHub naglakip sa usa ka publikong email address, ug bisan kung wala, ang mga scraper nag-cross-reference sa imong username batok sa ubang mga tinubdan sa publiko nga datos — npm packages, commit metadata, forum posts, ug leaked data breaches. Ang mga automated pipelines dayon nagpadato niini nga mga rekord gamit ang mga propesyonal nga email nga gikan sa mga serbisyo sama sa Hunter.io o Apollo, ang tanan walay bisan unsang direktang interaksyon gikan kanimo.

Kini anaa sa legal nga gray nga lugar. Samtang ang pag-scrap sa mga datos nga magamit sa publiko kasagaran dili gidili, ang pagpadala sa wala gipangayo nga komersyal nga email nga walay pagtugot mahimong makalapas sa CAN-SPAM, GDPR, o CASL depende sa hurisdiksyon. Ang Mga Termino sa Serbisyo sa GitHub tin-aw nga nagdili sa pag-scrape alang sa mga katuyoan sa spamming, apan ang pagpatuman batok sa nakasala nga mga kompanya nagpabilin nga dili managsama ug kadaghanan gimaneho sa reklamo.

Unsaon nako makunhuran ang akong pagkaladlad sa spam nga gipuntirya sa developer?

Itago ang imong email sa GitHub pinaagi sa pagbutang niini sa pribado sa mga setting sa profile ug paggamit sa usa ka maskara nga adres para sa mga commit pinaagi sa Git config. Ikonsiderar ang paggamit sa usa ka dedikado nga alyas sa developer alang sa open-source nga trabaho. Kung nagtukod ka og mga himan alang sa usa ka team, ang mga platform sama sa Mewayz — usa ka 207-module nga negosyo nga OS sa $19/mo (app.mewayz.com) — tugotan ka nga isentro ang mga operasyon nga dili isabwag ang personal nga mga detalye sa pagkontak sa mga publikong repositoryo.

Nganong ang mga kompanya nga gipaluyohan sa YC nagsalig sa pag-scrap sa GitHub imbes sa lehitimong pagpamaligya?

Ang pagpit-os sa mamumuhunan aron ipakita ang paspas nga pag-uswag sa tiggamit nagmugna og mga insentibo aron unahon ang gidaghanon kaysa pagtugot. Ang pag-scrape sa GitHub naghatod sa labi ka gipunting nga mga lead - ang mga developer aktibo nga nagsulbad sa piho nga mga problema - sa hapit-zero nga marginal nga gasto. Kini usa ka laktod nga paagi nga nagbaligya sa dugay nga pagsalig sa brand alang sa mubo nga termino nga sukatan sa pipeline. Ang mga kompanya nga seryoso bahin sa malungtarong pagtubo nagtukod ug mga produkto nga angayan nga madiskubre sa organikong paagi, imbes nga i-hijack ang mga workflow sa mga developer ingon usa ka database sa pagpangita.

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start managing your business smarter today

Join 6,203+ businesses. Free forever plan · No credit card required.

Ready to put this into practice?

Join 6,203+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime