# Voice Summary

> บันทึกครั้งเดียว แล้วค้นหาสิ่งที่พูดไว้ได้ตลอด

Canonical: https://erp-ai.ireadcustomer.com/th/products/voice_summary
Published: 2026-05-02
Category: Speech-to-Text สำหรับข้อมูลธุรกิจ

## Summary

วอยซ์โน้ตกลายเป็น record ที่มีโครงสร้าง ค้นหาได้ และมีสรุปจาก AI พร้อมผูกกับลูกค้าและโปรเจกต์ที่ถูกต้องภายในไม่กี่นาที

## สิ่งที่คุณได้รับ

- **ถอดเสียงไฟล์ยาว** — ระบบ chunker ภายในและ Gemini pipeline รองรับ recording ยาวประมาณสองชั่วโมงโดยไม่ตัดหาย ffmpeg ช่วยเตรียมเสียงและแบ่งงานเป็น batch ขนาน
- **บริบทธุรกิจแบบมีโครงสร้าง** — ข้อมูลที่ดึงได้แสดงเป็นแถวอ่านง่าย เช่น ชื่อลูกค้า โปรเจกต์ action item และ blocker ไม่ใช่ raw JSON
- **ถามย้อนหลังได้** — AI panel ด้านขวารองรับคำถามเฉพาะเกี่ยวกับ recording เช่น เราสัญญาว่าจะส่งของเมื่อไร และตอบได้ในไม่กี่วินาที
- **ทนต่อปัญหา production** — มี stuck-row sweep และปุ่ม retry เอง งานที่ worker ถูก kill จะไม่ค้าง processing ไปตลอด

## Detail

Voice Summary เปลี่ยนสายโทรให้กลายเป็น record ที่ใช้งานได้จริง ใส่ recording เข้าไป แล้วได้ structured summary, action list และ transcript ที่ค้นหาได้กลับมา โดยผูกกับลูกค้าและโปรเจกต์ที่ถูกต้องอัตโนมัติ

## ปัญหาไฟล์สองชั่วโมง

บริการถอดเสียงจำนวนมากเริ่มพังเมื่อยาวเกินยี่สิบนาที แต่ประชุมขายจริง สายลูกค้า และ internal review มักยาวกว่านั้น Voice Summary ใช้ ffmpeg-based chunker เพื่อส่ง audio ให้ Gemini pipeline เป็นส่วน ๆ แบบขนาน แล้วรวมผลกลับเป็น narrative ที่อ่านต่อเนื่อง

> ทางที่สั้นที่สุดจาก meeting ไปถึง follow-up email คือทางที่ไม่ต้องกลับไปฟังซ้ำ

## ได้อะไรกลับมา

- Transcript ที่จัดรูปแบบอ่านง่าย
- Summary ที่ผูกกับลูกค้าและโปรเจกต์
- Action list พร้อมเจ้าของงาน
- กล่องถามย้อนหลัง: ถาม recording ได้ทันทีและได้คำตอบในไม่กี่วินาที

## ใช้คู่กับ

- [CRM](https://erp-ai.ireadcustomer.com/th/products/crm.md): ทำให้ลูกค้าเป็นข้อมูลหลักของบริษัท ไม่ใช่แถวหนึ่งในสเปรดชีต
- [AI Chat Summary](https://erp-ai.ireadcustomer.com/th/products/ai_chat.md): บทสนทนา LINE กลายเป็น ledger ที่สะอาดของสิ่งที่ตกลงกันจริง
- [Projects](https://erp-ai.ireadcustomer.com/th/products/projects.md): งาน คน และบทสนทนา อยู่บน timeline เดียวกัน

## คำถามที่พบบ่อย

### หนึ่ง recording ยาวได้แค่ไหน

ทดสอบกับประชุมภายในยาวสองชั่วโมงแล้ว ระบบจะแบ่ง audio เป็น chunk ขนานและรวมผลกลับมาแบบโปร่งใส

### รองรับภาษาอะไร

Thai และ English เป็นภาษา production หลัก ภาษาอื่นใช้งานได้บางส่วนแต่ยังไม่ประกาศ support อย่างเป็นทางการ

### ไฟล์เสียงเก็บไว้ที่ไหน

อยู่ใน Drive ของ tenant คุณเอง (Google Workspace) แพลตฟอร์มไม่เก็บ raw audio นอกขอบเขต tenant
