ในยุคที่ AI พัฒนาไปไกลแบบก้าวกระโดด หนึ่งในเทคโนโลยีที่น่าตื่นตะลึงคือ “AI สร้างเสียงเลียนแบบคน” หรือที่เรียกว่า Voice Cloning ระบบนี้สามารถสร้างเสียงพูดที่เหมือนต้นฉบับแทบแยกไม่ออก ทั้งน้ำเสียง สำเนียง และจังหวะการพูด เพียงแค่ป้อนตัวอย่างเสียงไม่กี่วินาที

ฟังดูน่าทึ่ง แล้วมันมีประโยชน์ยังไง?

  • นักสร้างคอนเทนต์สามารถใช้เสียงตัวเองโดยไม่ต้องอัดซ้ำ

  • นักพากย์หรือดาราสามารถต่อยอดงานโดยไม่ต้องมาพูดใหม่ทุกประโยค

  • งานด้านการแพทย์ เช่น การสร้างเสียงให้ผู้ป่วยที่พูดไม่ได้กลับมาสื่อสารได้อีกครั้ง

แต่ก็ไม่ได้มีแค่ด้านดี
เสียงเลียนแบบนี้สามารถถูกใช้ในทางที่ผิด เช่น

  • หลอกให้คนเชื่อว่าคนใกล้ชิดกำลังโทรมาขอเงิน

  • ปลอมเสียงผู้บริหารเพื่อสั่งโอนเงินในองค์กร

  • ทำลายความน่าเชื่อถือของบุคคลสาธารณะ

แล้วเราจะรู้ได้ยังไงว่าเสียงที่ได้ยินนั้นเป็นของจริงหรือไม่?
ปัจจุบันยังไม่มีเครื่องมือที่แม่นยำพอสำหรับคนทั่วไปจะตรวจสอบได้ ต้องอาศัยการสังเกตพฤติกรรมอื่นประกอบ เช่น การสื่อสารที่ผิดปกติ หรือคำพูดที่ไม่สอดคล้องกับบุคคลนั้น ๆ

สรุปคือ... AI สร้างเสียงเลียนแบบคนมีประโยชน์มาก ถ้าใช้ในทางที่ถูกต้อง แต่ก็มีความเสี่ยงที่ต้องจับตามองไม่ให้กลายเป็นเครื่องมือโจรกรรมข้อมูลหรือทำลายความน่าเชื่อถือของใครบางคน


ฟังเสียงใคร ก็อย่าลืม “ฟังให้ครบ” ทั้งบริบทและสัญญาณที่มากกว่าคำพูดนะครับ เสียงอาจเหมือน แต่ใจความอาจไม่ใช่!


เครดิต: อ้างอิงจากแหล่งข้อมูลด้านเทคโนโลยีเสียง AI เช่น Descript, ElevenLabs, Mozilla Common Voice และงานวิจัยจาก MIT Technology Review