Hacker News

Người dẫn chương trình phát thanh David Greene cho biết công cụ NotebookLM của Google đã đánh cắp giọng nói của anh ấy

Người dẫn chương trình phát thanh David Greene cho biết công cụ NotebookLM của Google đã đánh cắp giọng nói của anh ấy Phân tích toàn diện về đài phát thanh này cung cấp bài kiểm tra chi tiết - Hệ điều hành kinh doanh Mewayz.

9 đọc tối thiểu

Mewayz Team

Editorial Team

Hacker News

Bây giờ tôi có đủ bối cảnh để viết bài blog. Đây là nội dung HTML hoàn chỉnh:

Người dẫn chương trình phát thanh David Greene cho biết công cụ NotebookLM của Google đã đánh cắp giọng nói của anh ấy

Người dẫn chương trình kỳ cựu của NPR David Greene đã công khai cáo buộc Google sao chép giọng nói của anh ấy mà không có sự đồng ý cho tính năng Tổng quan về âm thanh NotebookLM lan truyền của nó. Cáo buộc làm nổi bật câu hỏi mà mọi người sáng tạo nội dung và chủ doanh nghiệp nên hỏi: ai thực sự sở hữu tiếng nói, thương hiệu và danh tính của bạn trong thời đại AI sáng tạo?

Chính xác thì chuyện gì đã xảy ra giữa David Greene và Google NotebookLM?

David Greene đã dành nhiều năm làm người đồng dẫn chương trình Morning Edition của NPR, một trong những chương trình phát thanh được nghe rộng rãi nhất ở Hoa Kỳ. Giọng hát của anh ấy có thể được hàng triệu người nghe nhận ra ngay lập tức. Khi Google ra mắt tính năng Tổng quan về âm thanh của NotebookLM vào cuối năm 2024, công cụ này đã nhanh chóng lan truyền nhờ khả năng biến các tài liệu đã tải lên thành các cuộc trò chuyện kiểu podcast tự nhiên đến kinh ngạc giữa hai máy chủ do AI tạo ra.

Greene và nhiều thính giả nhận thấy điều gì đó đáng lo ngại: một trong những giọng nói do AI tạo ra có sự tương đồng đáng kinh ngạc với nhịp giọng, giai điệu và phong cách truyền tải của chính Greene. Greene tuyên bố công khai rằng cả ông và người đại diện của ông đều chưa từng được Google liên hệ để xin phép, cấp phép hoặc bồi thường. Google phủ nhận giọng nói được mô phỏng theo bất kỳ cá nhân cụ thể nào, khẳng định rằng giọng nói của họ là hoàn toàn tổng hợp và không phải là bản sao có chủ ý của người thật.

Bất kể mục đích là gì, vụ việc đã tạo ra nỗi sợ hãi đang hình thành trên các phương tiện truyền thông, giải trí và kinh doanh: Hệ thống AI được đào tạo trên cơ sở dữ liệu âm thanh công cộng khổng lồ có thể tái tạo chân dung của ai đó đủ gần để gây ra tổn hại thực sự, cho dù công ty có thừa nhận cố ý nhân bản hay không.

Tại sao chủ doanh nghiệp nên quan tâm đến việc nhân bản giọng nói AI?

Đây không chỉ là vấn đề của người nổi tiếng. Nếu bạn điều hành một doanh nghiệp, sản xuất nội dung, tổ chức podcast hoặc quay video đào tạo thì tiếng nói và nhận diện thương hiệu của bạn là tài sản thương mại. Trường hợp Greene minh họa những tài sản đó có thể được sao chép, phân phối lại hoặc giảm giá trị nhanh chóng như thế nào mà bạn không hề hay biết.

💡 BẠN CÓ BIẾT?

Mewayz replaces 8+ business tools in one platform

CRM · Hóa đơn · Nhân sự · Dự án · Đặt chỗ · Thương mại điện tử · POS · Phân tích. Gói miễn phí vĩnh viễn có sẵn.

Bắt đầu miễn phí →

Quyền công khai gặp rủi ro: Nhiều tiểu bang của Hoa Kỳ bảo vệ các cá nhân khỏi việc sử dụng trái phép hình ảnh chân dung của họ cho mục đích thương mại, bao gồm cả giọng nói của họ. Giọng nói giống do AI tạo ra có thể vi phạm các biện pháp bảo vệ này.

Độ mờ của dữ liệu đào tạo: Hầu hết các công ty AI không tiết lộ chính xác bản ghi âm nào được sử dụng để đào tạo các mô hình tổng hợp giọng nói, khiến người sáng tạo không biết liệu công việc của họ đã được sử dụng hay chưa.

Chưa có luật giọng nói AI liên bang: Mặc dù một số bang đã ban hành hoặc thông qua luật nhắm mục tiêu vào các tác phẩm giả mạo AI và bản sao giọng nói, nhưng vẫn chưa có tiêu chuẩn toàn diện của liên bang, tạo ra sự chắp vá trong các biện pháp bảo vệ.

Xói mòn niềm tin thương hiệu: Nếu khách hàng hoặc khán giả nghe thấy giọng nói AI giống như giọng nói của bạn để quảng bá sản phẩm hoặc ý tưởng mà bạn chưa bao giờ ủng hộ, thì sự nhầm lẫn dẫn đến có thể làm tổn hại đến uy tín thương hiệu mà bạn khó có thể kiếm được.

Tiền lệ từ các cuộc đình công trong lĩnh vực giải trí: Các cuộc đình công của SAG-AFTRA và WGA năm 2023 đã đặt AI sao chép hoạt động của con người làm trung tâm của các cuộc đàm phán lao động, chứng minh rằng việc bảo vệ giọng nói và chân dung là mối quan tâm chính của doanh nghiệp chứ không phải là một lý thuyết pháp lý thích hợp.

Tổng quan về âm thanh của NotebookLM thực sự hoạt động như thế nào?

NotebookLM của Google cho phép người dùng tải lên các tài liệu như PDF, bài viết và ghi chú, sau đó tạo bản tóm tắt âm thanh hội thoại có hai máy chủ AI thảo luận về tài liệu. Công nghệ này dựa trên các mô hình ngôn ngữ lớn để tạo tập lệnh và tổng hợp văn bản thành giọng nói nâng cao để sản xuất giọng nói. Google cho biết giọng nói được tạo từ dữ liệu tổng hợp, không được sao chép từ các cá nhân có thể nhận dạng được.

Tuy nhiên, các mô hình chuyển văn bản thành giọng nói hiện đại được đào tạo dựa trên kho văn bản giọng nói được ghi âm khổng lồ. Ngay cả khi giọng nói đầu ra cuối cùng không phải là bản sao một-một, thì ảnh hưởng tổng hợp của hàng nghìn giờ lời nói thực của con người chắc chắn sẽ định hình kết quả. Các nhà phê bình cho rằng điều này làm cho sự khác biệt giữa "tổng hợp" và "nhân bản" trở nên có ý nghĩa hơn.

Ready to Simplify Your Operations?

Whether you need CRM, invoicing, HR, or all 207 modules — Mewayz has you covered. 138K+ businesses already made the switch.

Get Started Free →

Dùng Thử Mewayz Miễn Phí

Nền tảng tất cả trong một cho CRM, hóa đơn, dự án, Nhân sự & hơn thế nữa. Không cần thẻ tín dụng.

Bắt đầu quản lý doanh nghiệp của bạn thông minh hơn ngay hôm nay.

Tham gia 30,000+ doanh nghiệp. Gói miễn phí vĩnh viễn · Không cần thẻ tín dụng.

Tìm thấy điều này hữu ích? Chia sẻ nó.

Sẵn sàng áp dụng vào thực tế?

Tham gia cùng 30,000+ doanh nghiệp đang sử dụng Mewayz. Gói miễn phí vĩnh viễn — không cần thẻ tín dụng.

Bắt đầu Dùng thử Miễn phí →

Sẵn sàng hành động?

Bắt đầu dùng thử Mewayz miễn phí của bạn ngay hôm nay

All-in-one business platform. No credit card required.

Bắt đầu miễn phí →

Dùng thử 14 ngày miễn phí · Không cần thẻ tín dụng · Hủy bất kỳ lúc nào