# Buod ng Boses

> Mag-record ng isang beses. Hanapin ang binibigkas na salita magpakailanman.

Canonical: https://erp-ai.ireadcustomer.com/fil/products/voice_summary
Published: 2026-05-02
Category: Speech-to-Text Business Intelligence

## Summary

Ang mga voice notes ay nagiging structured, nahahanap, AI-summarised records — naka-attach sa tamang customer at proyekto, handa sa ilang minuto, hindi araw.

## Kung ano ang makukuha mo

- **Mahabang anyo na transkripsyon** — Ang panloob na chunker + Gemini pipeline ay humahawak ng 2 oras na pag-record nang walang truncation. ffmpeg paunang pagpoproseso ng mga strips ng katahimikan at mga chunks parallel batch.
- **Nakabalangkas na konteksto ng negosyo** — Nagre-render ang mga na-extract na field bilang mga nababasang row — pangalan ng customer, proyekto, mga item ng aksyon, blocker — hindi raw JSON.
- **Magtanong ng kahit ano, pagkatapos ng katotohanan** — Ang kanang-side AI panel ay tumatagal ng mga ad-hoc na tanong tungkol sa pag-record: 'Ano ang ipinangako namin sa paghahatid?' sumagot sa ilang segundo.
- **Nababanat sa mga pagkabigo sa ops** — Stuck-row sweep + manual retry button. Ang isang pinatay na manggagawa ay hindi na nag-iiwan ng isang recording na umiikot magpakailanman.

## Detail

Ginagawa ng Buod ng Boses ang isang tawag sa telepono sa isang magagamit na tala. Ang pag-record ay pumapasok; lumabas ang isang structured na buod, isang listahan ng aksyon, at isang mahahanap na transcript — awtomatikong naka-attach sa tamang customer at proyekto.

## Ang dalawang oras na problema

Karamihan sa mga serbisyo ng transkripsyon ay sumasakal sa nakalipas na dalawampung minuto. Mga totoong pagpupulong sa pagbebenta, mga tawag sa customer, mga panloob na pagsusuri — tumatakbo ang mga ito nang matagal. Gumagamit ang Buod ng Boses ng isang chunker na nakabatay sa ffmpeg upang pakainin ang mga Gemini pipeline parallel slice, pagkatapos ay muling pagsasamahin ang mga ito sa isang magkakaugnay na salaysay.

> Ang pinakamaikling landas mula sa isang pulong patungo sa isang follow-up na email ay ang hindi muling pakikinig.

## Ang babalikan mo

- Isang malinis, naka-format na transcript.
- Isang buod na naka-key sa customer at proyekto.
- Isang listahan ng aksyon na may pinangalanang mga may-ari.
- Isang ad-hoc query box: tanungin ang recording kahit ano, makakuha ng sagot sa ilang segundo.

## Gumawa ng may

- [CRM](https://erp-ai.ireadcustomer.com/fil/products/crm.md): Ang mga customer bilang isang first-class na bagay, hindi isang row sa isang spreadsheet.
- [AI Buod ng Chat](https://erp-ai.ireadcustomer.com/fil/products/ai_chat.md): LINE ang mga pag-uusap ay nagiging malinis na ledger ng kung ano talaga ang napagkasunduan.
- [Mga proyekto](https://erp-ai.ireadcustomer.com/fil/products/projects.md): Ang trabaho, ang mga tao, at ang mga pag-uusap — sa isang timeline.

## Madalas itanong

### Gaano katagal ang isang solong pag-record?

Sinubok sa 2 oras na panloob na pagpupulong. Ang audio ay nahahati sa magkatulad na mga tipak at muling pinagsama nang malinaw.

### Anong mga wika?

Thai at English ang production target. Gumagana ang ibang mga wika ngunit hindi pa opisyal na suportado.

### Saan naka-imbak ang audio?

Sa loob ng Drive (Google Workspace) ng iyong nangungupahan. Ang platform ay hindi kailanman nagtataglay ng hilaw na audio sa labas ng hangganan ng nangungupahan.
