ในยุคที่ AI พัฒนาไปไกลแบบก้าวกระโดด หนึ่งในเทคโนโลยีที่น่าตื่นตะลึงคือ “AI สร้างเสียงเลียนแบบคน” หรือที่เรียกว่า Voice Cloning ระบบนี้สามารถสร้างเสียงพูดที่เหมือนต้นฉบับแทบแยกไม่ออก ทั้งน้ำเสียง สำเนียง และจังหวะการพูด เพียงแค่ป้อนตัวอย่างเสียงไม่กี่วินาที
ฟังดูน่าทึ่ง แล้วมันมีประโยชน์ยังไง?
-
นักสร้างคอนเทนต์สามารถใช้เสียงตัวเองโดยไม่ต้องอัดซ้ำ
-
นักพากย์หรือดาราสามารถต่อยอดงานโดยไม่ต้องมาพูดใหม่ทุกประโยค
-
งานด้านการแพทย์ เช่น การสร้างเสียงให้ผู้ป่วยที่พูดไม่ได้กลับมาสื่อสารได้อีกครั้ง
แต่ก็ไม่ได้มีแค่ด้านดี
เสียงเลียนแบบนี้สามารถถูกใช้ในทางที่ผิด เช่น
-
หลอกให้คนเชื่อว่าคนใกล้ชิดกำลังโทรมาขอเงิน
-
ปลอมเสียงผู้บริหารเพื่อสั่งโอนเงินในองค์กร
-
ทำลายความน่าเชื่อถือของบุคคลสาธารณะ
แล้วเราจะรู้ได้ยังไงว่าเสียงที่ได้ยินนั้นเป็นของจริงหรือไม่?
ปัจจุบันยังไม่มีเครื่องมือที่แม่นยำพอสำหรับคนทั่วไปจะตรวจสอบได้ ต้องอาศัยการสังเกตพฤติกรรมอื่นประกอบ เช่น การสื่อสารที่ผิดปกติ หรือคำพูดที่ไม่สอดคล้องกับบุคคลนั้น ๆ
สรุปคือ... AI สร้างเสียงเลียนแบบคนมีประโยชน์มาก ถ้าใช้ในทางที่ถูกต้อง แต่ก็มีความเสี่ยงที่ต้องจับตามองไม่ให้กลายเป็นเครื่องมือโจรกรรมข้อมูลหรือทำลายความน่าเชื่อถือของใครบางคน
ฟังเสียงใคร ก็อย่าลืม “ฟังให้ครบ” ทั้งบริบทและสัญญาณที่มากกว่าคำพูดนะครับ เสียงอาจเหมือน แต่ใจความอาจไม่ใช่!
เครดิต: อ้างอิงจากแหล่งข้อมูลด้านเทคโนโลยีเสียง AI เช่น Descript, ElevenLabs, Mozilla Common Voice และงานวิจัยจาก MIT Technology Review