Hacker News

Prezenter radiowy David Greene twierdzi, że narzędzie Google NotebookLM ukradło mu głos

Prezenter radiowy David Greene twierdzi, że narzędzie Google NotebookLM ukradło mu głos Ta kompleksowa analiza oferuje szczegółowe badanie radia — Mewayz Business OS.

5 min. przeczytaj

Mewayz Team

Editorial Team

Hacker News

Teraz mam wystarczający kontekst, aby napisać post na blogu. Oto pełna treść HTML:

Prezenter radiowy David Greene twierdzi, że narzędzie Google NotebookLM ukradło mu głos

Doświadczony gospodarz NPR David Greene publicznie oskarżył Google o klonowanie jego głosu bez zgody na potrzeby wirusowej funkcji przeglądu audio NotebookLM. Zarzut rzuca ostre światło na pytanie, które powinien sobie zadać każdy twórca treści i właściciel firmy: kto tak naprawdę jest właścicielem Twojego głosu, Twojej marki i Twojej tożsamości w dobie generatywnej sztucznej inteligencji?

Co dokładnie wydarzyło się pomiędzy Davidem Greene’em a Google NotebookLM?

David Greene przez lata był współgospodarzem Morning Edition stacji NPR, jednego z najpopularniejszych programów radiowych w Stanach Zjednoczonych. Jego głos jest natychmiast rozpoznawalny przez miliony słuchaczy. Kiedy pod koniec 2024 r. firma Google uruchomiła funkcję przeglądu audio programu NotebookLM, narzędzie szybko zyskało popularność dzięki możliwości przekształcania przesłanych dokumentów w zaskakująco naturalne rozmowy w stylu podcastu między dwoma hostami generowanymi przez sztuczną inteligencję.

Greene i liczni słuchacze zauważyli coś niepokojącego: jeden z głosów wygenerowanych przez sztuczną inteligencję był uderzająco podobny do rytmu, tonu i stylu wypowiedzi samego Greene'a. Greene oświadczył publicznie, że Google nigdy nie kontaktował się z nim ani z jego przedstawicielami w sprawie pozwolenia, licencji lub wynagrodzenia. Google zaprzeczył, że głos był wzorowany na konkretnej osobie, utrzymując, że jego głosy są w pełni syntetyczne, a nie zamierzone repliki prawdziwych ludzi.

Niezależnie od intencji incydent skrystalizował strach, który narastał w mediach, rozrywce i biznesie: systemy sztucznej inteligencji wyszkolone na ogromnych zbiorach danych dotyczących publicznego sprzętu audio mogą odtworzyć czyjeś podobieństwo na tyle dokładnie, aby wyrządzić rzeczywistą szkodę, niezależnie od tego, czy firma przyznaje się do celowego klonowania.

Dlaczego właściciele firm powinni dbać o klonowanie głosu AI?

To nie jest tylko problem gwiazd. Jeśli prowadzisz firmę, produkujesz treści, hostujesz podcast lub nagrywasz filmy szkoleniowe, Twój głos i tożsamość marki stanowią aktywa komercyjne. Sprawa Greene'a ilustruje, jak szybko te aktywa mogą zostać zreplikowane, redystrybuowane lub zdewaluowane bez Twojej wiedzy.

💡 CZY WIESZ?

Mewayz replaces 8+ business tools in one platform

CRM · Fakturowanie · HR · Projekty · Rezerwacje · eCommerce · POS · Analityka. Darmowy plan dostępny na zawsze.

Zacznij za darmo →

Zagrożone prawo do wizerunku: wiele stanów USA chroni osoby przed nieuprawnionym komercyjnym wykorzystaniem ich podobizny, w tym głosu. Wygenerowane przez sztuczną inteligencję podobne głosy mogą naruszać te zabezpieczenia.

Nieprzezroczystość danych szkoleniowych: większość firm zajmujących się sztuczną inteligencją nie ujawnia dokładnie, które nagrania audio są wykorzystywane do uczenia modeli syntezy głosu, pozostawiając twórców nieświadomych, czy ich praca została wykorzystana.

Nie ma jeszcze federalnego prawa dotyczącego głosu dotyczącego sztucznej inteligencji: chociaż kilka stanów wprowadziło lub przyjęło przepisy dotyczące fałszywych fałszywych informacji i replik głosu AI, nie ma kompleksowego standardu federalnego, co tworzy mozaikę zabezpieczeń.

Erozja zaufania do marki: jeśli klienci lub odbiorcy usłyszą głos sztucznej inteligencji przypominający Twój, promujący produkty lub pomysły, których nigdy nie popierałeś, wynikające z tego zamieszanie może zaszkodzić ciężko wypracowanej wiarygodności marki.

Precedens w postaci strajków w branży rozrywkowej: Strajki SAG-AFTRA i WGA w 2023 r. umieściły replikację działań człowieka przez sztuczną inteligencję w centrum negocjacji pracowniczych, potwierdzając, że ochrona głosu i podobieństwa jest głównym problemem biznesowym, a nie niszową teorią prawną.

Jak faktycznie działa przegląd audio w NotebookLM?

Aplikacja NotebookLM firmy Google umożliwia użytkownikom przesyłanie dokumentów, takich jak pliki PDF, artykuły i notatki, a następnie generuje podsumowanie dźwiękowe konwersacji z udziałem dwóch gospodarzy AI omawiających materiał. Technologia opiera się na dużych modelach językowych do generowania skryptów i zaawansowanej syntezie tekstu na mowę do produkcji głosu. Google twierdzi, że głosy są tworzone na podstawie danych syntetycznych, a nie klonowanych od możliwych do zidentyfikowania osób.

Jednak nowoczesne modele zamiany tekstu na mowę są szkolone na ogromnych zbiorach nagranej mowy. Nawet jeśli ostateczny głos wyjściowy nie jest klonem jeden do jednego, łączny wpływ tysięcy godzin prawdziwej ludzkiej mowy nieuchronnie wpływa na wynik. Krytycy twierdzą, że sprawia to, że rozróżnienie między „syntetycznymi” i „klonowanymi” jest bardziej sem

All Your Business Tools in One Place

Stop juggling multiple apps. Mewayz combines 207 tools for just $19/month — from inventory to HR, booking to analytics. No credit card required to start.

Try Mewayz Free →

Wypróbuj Mewayz za Darmo

Kompleksowa platforma dla CRM, fakturowania, projektów, HR i więcej. Karta kredytowa nie jest wymagana.

Zacznij dziś zarządzać swoją firmą mądrzej.

Dołącz do 30,000+ firm. Plan darmowy na zawsze · Bez karty kredytowej.

Uznałeś to za przydatne? Udostępnij to.

Gotowy, aby wprowadzić to w życie?

Dołącz do 30,000+ firm korzystających z Mewayz. Darmowy plan forever — karta kredytowa nie jest wymagana.

Rozpocznij darmowy okres próbny →

Gotowy, by podjąć działanie?

Rozpocznij swój darmowy okres próbny Mewayz dziś

Platforma biznesowa wszystko w jednym. Karta kredytowa nie jest wymagana.

Zacznij za darmo →

14-dniowy darmowy okres próbny · Bez karty kredytowej · Anuluj w dowolnym momencie