Voice Summary
บันทึกครั้งเดียว แล้วค้นหาสิ่งที่พูดไว้ได้ตลอด
Voice Summary เปลี่ยนสายโทรให้กลายเป็น record ที่ใช้งานได้จริง ใส่ recording เข้าไป แล้วได้ structured summary, action list และ transcript ที่ค้นหาได้กลับมา โดยผูกกับลูกค้าและโปรเจกต์ที่ถูกต้องอัตโนมัติ
ปัญหาไฟล์สองชั่วโมง
บริการถอดเสียงจำนวนมากเริ่มพังเมื่อยาวเกินยี่สิบนาที แต่ประชุมขายจริง สายลูกค้า และ internal review มักยาวกว่านั้น Voice Summary ใช้ ffmpeg-based chunker เพื่อส่ง audio ให้ Gemini pipeline เป็นส่วน ๆ แบบขนาน แล้วรวมผลกลับเป็น narrative ที่อ่านต่อเนื่อง
ทางที่สั้นที่สุดจาก meeting ไปถึง follow-up email คือทางที่ไม่ต้องกลับไปฟังซ้ำ
ได้อะไรกลับมา
- Transcript ที่จัดรูปแบบอ่านง่าย
- Summary ที่ผูกกับลูกค้าและโปรเจกต์
- Action list พร้อมเจ้าของงาน
- กล่องถามย้อนหลัง: ถาม recording ได้ทันทีและได้คำตอบในไม่กี่วินาที
ถอดเสียงไฟล์ยาว
ระบบ chunker ภายในและ Gemini pipeline รองรับ recording ยาวประมาณสองชั่วโมงโดยไม่ตัดหาย ffmpeg ช่วยเตรียมเสียงและแบ่งงานเป็น batch ขนาน
บริบทธุรกิจแบบมีโครงสร้าง
ข้อมูลที่ดึงได้แสดงเป็นแถวอ่านง่าย เช่น ชื่อลูกค้า โปรเจกต์ action item และ blocker ไม่ใช่ raw JSON
ถามย้อนหลังได้
AI panel ด้านขวารองรับคำถามเฉพาะเกี่ยวกับ recording เช่น เราสัญญาว่าจะส่งของเมื่อไร และตอบได้ในไม่กี่วินาที
ทนต่อปัญหา production
มี stuck-row sweep และปุ่ม retry เอง งานที่ worker ถูก kill จะไม่ค้าง processing ไปตลอด
หนึ่ง recording ยาวได้แค่ไหน
ทดสอบกับประชุมภายในยาวสองชั่วโมงแล้ว ระบบจะแบ่ง audio เป็น chunk ขนานและรวมผลกลับมาแบบโปร่งใส
รองรับภาษาอะไร
Thai และ English เป็นภาษา production หลัก ภาษาอื่นใช้งานได้บางส่วนแต่ยังไม่ประกาศ support อย่างเป็นทางการ
ไฟล์เสียงเก็บไว้ที่ไหน
อยู่ใน Drive ของ tenant คุณเอง (Google Workspace) แพลตฟอร์มไม่เก็บ raw audio นอกขอบเขต tenant