Hacker News

Радиоведущий Дэвид Грин говорит, что инструмент Google NotebookLM украл его голос

Радиоведущий Дэвид Грин говорит, что инструмент Google NotebookLM украл его голос Этот комплексный анализ радио предлагает детальное рассмотрение — Mewayz Business OS.

1 минута чтения

Mewayz Team

Editorial Team

Hacker News

Теперь у меня достаточно контекста, чтобы написать сообщение в блоге. Вот полный HTML-контент:

Радиоведущий Дэвид Грин заявил, что инструмент Google NotebookLM украл его голос

Ветеран NPR Дэвид Грин публично обвинил Google в клонировании его голоса без согласия для своей вирусной функции обзора аудио NotebookLM. Это обвинение выдвигает на первый план вопрос, который должен задать себе каждый создатель контента и владелец бизнеса: кому на самом деле принадлежит ваш голос, ваш бренд и ваша личность в эпоху генеративного искусственного интеллекта?

Что именно произошло между Дэвидом Грином и Google NotebookLM?

Дэвид Грин в течение многих лет был соведущим утреннего выпуска NPR, одной из самых популярных радиопрограмм в Соединенных Штатах. Его голос мгновенно узнают миллионы слушателей. Когда в конце 2024 года Google запустил функцию обзора звука NotebookLM, этот инструмент быстро стал вирусным благодаря своей способности превращать загруженные документы в удивительно естественные разговоры в стиле подкаста между двумя хостами, созданными искусственным интеллектом.

Грин и многочисленные слушатели заметили нечто тревожное: один из голосов, сгенерированных искусственным интеллектом, поразительно напоминал собственную вокальную частоту, тон и стиль речи Грина. Грин публично заявил, что ни к нему, ни к его представителям Google никогда не обращалась за разрешением, лицензированием или компенсацией. Google отрицает, что голос был смоделирован по образцу какого-либо конкретного человека, утверждая, что его голоса полностью синтетические и не являются преднамеренными копиями реальных людей.

Независимо от намерений, этот инцидент кристаллизовал страх, который накапливался в средствах массовой информации, индустрии развлечений и бизнесе: системы искусственного интеллекта, обученные на огромных наборах данных публичного аудио, могут воспроизводить чье-либо сходство достаточно точно, чтобы причинить реальный вред, независимо от того, признается компания в преднамеренном клонировании или нет.

Почему владельцам бизнеса следует беспокоиться о клонировании голоса с помощью искусственного интеллекта?

Это проблема не только знаменитостей. Если вы ведете бизнес, производите контент, ведете подкаст или записываете обучающие видеоролики, ваш голос и фирменный стиль являются коммерческими активами. Случай Грина показывает, как быстро эти активы могут быть воспроизведены, перераспределены или обесценены без вашего ведома.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Начать бесплатно →

Право на гласность под угрозой: многие штаты США защищают людей от несанкционированного коммерческого использования их изображений, включая их голос. Похожие голоса, созданные искусственным интеллектом, могут нарушать эту защиту.

Непрозрачность обучающих данных. Большинство компаний, занимающихся искусственным интеллектом, не раскрывают, какие именно аудиозаписи используются для обучения моделей синтеза голоса, оставляя создателей в неведении относительно того, была ли использована их работа.

Федерального закона о голосе в области искусственного интеллекта пока нет. Несмотря на то, что несколько штатов ввели или приняли законы, направленные против дипфейков и реплик голоса с использованием искусственного интеллекта, не существует всеобъемлющего федерального стандарта, что создает разнородную систему защиты.

Подрыв доверия к бренду. Если клиенты или аудитория слышат голос искусственного интеллекта, который звучит как ваш, продвигая продукты или идеи, которые вы никогда не поддерживали, возникающая путаница может подорвать с трудом заработанное доверие к бренду.

Прецедент из забастовок в сфере развлечений: забастовки SAG-AFTRA и WGA 2023 года поставили репликацию человеческих действий с помощью ИИ в центр трудовых переговоров, установив, что защита голоса и изображения является основной бизнес-задачой, а не нишевой юридической теорией.

Как на самом деле работает обзор аудио в NotebookLM?

NotebookLM от Google позволяет пользователям загружать такие документы, как PDF-файлы, статьи и заметки, а затем генерирует разговорное аудио-резюме с участием двух хостов с искусственным интеллектом, которые обсуждают материал. Технология опирается на большие языковые модели для генерации сценариев и расширенный синтез текста в речь для создания голоса. Google утверждает, что голоса созданы на основе синтетических данных, а не клонированы от идентифицируемых лиц.

Однако современные модели преобразования текста в речь обучаются на огромных массивах записанной речи. Даже если окончательный выходной голос не является однозначным клоном, совокупное влияние тысяч часов реальной человеческой речи неизбежно формирует результат. Критики утверждают, что это делает различие между «синтетическим» и «клонированным» более очевидным.

Streamline Your Business with Mewayz

Mewayz brings 207 business modules into one platform — CRM, invoicing, project management, and more. Join 138,000+ users who simplified their workflow.

Start Free Today →

Try Mewayz Free

Единая платформа для CRM, выставления счетов, проектов, HR и многого другого. Банковская карта не требуется.

Start managing your business smarter today

Join 30,000+ businesses. Free forever plan · No credit card required.

Нашли это полезным? Поделиться.

Ready to put this into practice?

Join 30,000+ businesses using Mewayz. Free forever plan — no credit card required.

Начать бесплатный пробный период →

Готовы действовать?

Начните ваш бесплатный пробный период Mewayz сегодня

Бизнес-платформа все-в-одном. Кредитная карта не требуется.

Начать бесплатно →

14-дневный бесплатный пробный период · Без кредитной карты · Можно отменить в любой момент