Microsoft phát triển thành công AI có khả năng nhại lại giọng con người

Anh Vũ

Với 3 giây ghi âm giọng nói của bất kì ai, AI VALL-E có khả năng nhại lại giọng nói này ở các nội dung khác nhau thậm chí mô phỏng cả các hiệu ứng, tình trạng âm thanh giống hệt ghi âm gốc.

Không chỉ tự tạo hình ảnh từ văn bản, đọc thoại bằng văn bản hay cả video bằng văn bản, giờ đây AI còn có khả năng nhại lại giọng nói nhờ phát kiến mới từ Microsoft. AI VALL-E của Microsoft có khả năng nhại lại giọng nói của bất kì ai chỉ với mẫu thoại 3 giây.

Các nhà phát triển VALL-E tại Microsoft cho rằng AI này sẽ mang lại giá trị lớn phục vụ cho các công cụ biến văn bản thành lời nói. Thay vì sử dụng các giọng nói có sẵn, AI có thể tạo nên giọng nói mới với cảm xúc, ngữ điệu hay thậm chí mô phỏng cả tiếng động xung quanh.

Quy trình hoạt động của VALL-E.
Quy trình hoạt động của VALL-E.

Sử dụng công nghệ EnCodec được Meta công bố vào tháng 10 năm 2022, VALL-E sau khi nhận đoạn ghi âm kéo dài 3 giây từ người dùng sẽ phân tích giọng nói nhập vào, chia các thông tin xử lý được thành các khối và sau đó ghép những khối này lại với các từ ngữ khác dựa vào dữ liệu đã phân tích được.

Microsoft đã sử dụng 60.000 giờ hội thoại tiếng Anh từ 7.000 người nói khác nhau để huấn luyện VALL-E. Tuy nhiên, việc áp dụng vào thực tế cần theo đúng chỉ dẫn có sẵn, người nói cần tuân theo ngữ điệu được thiết lập trước để AI nắm bắt đúng từ đó mô phỏng chính xác những gì người dùng có thể nói.

Với hàng loạt AI có khả năng làm giả thông tin, VALL-E một lần nữa trở thành sản phẩm dễ bị sử dụng sai mục đích.
Với hàng loạt AI có khả năng làm giả thông tin, VALL-E một lần nữa trở thành sản phẩm dễ bị sử dụng sai mục đích.

Ngoài khả năng nhại lại giọng nói, VALL-E còn có thể mô phỏng tiếng động xung quanh từ đoạn ghi âm gốc. Ví dụ như dữ liệu ban đầu của người dùng được thực hiện thông qua điện thoại với âm thanh giống với gọi điện, VALL-E sẽ mô phỏng lại sóng âm thanh để có hiệu ứng tương tự.

Giống với nhiều trí tuệ nhân tạo khác, VALL-E cũng rất dễ bị sử dụng sai mục đích, kéo theo nhiều ảnh hưởng nghiêm trọng. Chính vì lý do đó, Microsoft không cung cấp bản thử nghiệm VALL-E tới người dùng đại chúng, đại diện Microsoft cho rằng VALL-E có thể bị sử dụng để lừa đảo, mạo danh hay tung tin đồn thất thiệt. AI này tới thời điểm hiện tại vẫn chỉ được sử dụng cho mục đích nghiên cứu.

Tin Cùng Chuyên Mục