Lumaktaw sa nilalaman
Speech-to-Text Business Intelligence Module 02

Buod ng Boses

Mag-record ng isang beses. Hanapin ang binibigkas na salita magpakailanman.


Ginagawa ng Buod ng Boses ang isang tawag sa telepono sa isang magagamit na tala. Ang pag-record ay pumapasok; lumabas ang isang structured na buod, isang listahan ng aksyon, at isang mahahanap na transcript — awtomatikong naka-attach sa tamang customer at proyekto.

Ang dalawang oras na problema

Karamihan sa mga serbisyo ng transkripsyon ay sumasakal sa nakalipas na dalawampung minuto. Mga totoong pagpupulong sa pagbebenta, mga tawag sa customer, mga panloob na pagsusuri — tumatakbo ang mga ito nang matagal. Gumagamit ang Buod ng Boses ng isang chunker na nakabatay sa ffmpeg upang pakainin ang mga Gemini pipeline parallel slice, pagkatapos ay muling pagsasamahin ang mga ito sa isang magkakaugnay na salaysay.

Ang pinakamaikling landas mula sa isang pulong patungo sa isang follow-up na email ay ang hindi muling pakikinig.

Ang babalikan mo

  • Isang malinis, naka-format na transcript.
  • Isang buod na naka-key sa customer at proyekto.
  • Isang listahan ng aksyon na may pinangalanang mga may-ari.
  • Isang ad-hoc query box: tanungin ang recording kahit ano, makakuha ng sagot sa ilang segundo.
Kung ano ang makukuha mo 4 aytem

Mahabang anyo na transkripsyon

Ang panloob na chunker + Gemini pipeline ay humahawak ng 2 oras na pag-record nang walang truncation. ffmpeg paunang pagpoproseso ng mga strips ng katahimikan at mga chunks parallel batch.

Nakabalangkas na konteksto ng negosyo

Nagre-render ang mga na-extract na field bilang mga nababasang row — pangalan ng customer, proyekto, mga item ng aksyon, blocker — hindi raw JSON.

Magtanong ng kahit ano, pagkatapos ng katotohanan

Ang kanang-side AI panel ay tumatagal ng mga ad-hoc na tanong tungkol sa pag-record: 'Ano ang ipinangako namin sa paghahatid?' sumagot sa ilang segundo.

Nababanat sa mga pagkabigo sa ops

Stuck-row sweep + manual retry button. Ang isang pinatay na manggagawa ay hindi na nag-iiwan ng isang recording na umiikot magpakailanman.

Gumawa ng may 03 mga module
Madalas itanong 03
Gaano katagal ang isang solong pag-record?

Sinubok sa 2 oras na panloob na pagpupulong. Ang audio ay nahahati sa magkatulad na mga tipak at muling pinagsama nang malinaw.

Anong mga wika?

Thai at English ang production target. Gumagana ang ibang mga wika ngunit hindi pa opisyal na suportado.

Saan naka-imbak ang audio?

Sa loob ng Drive (Google Workspace) ng iyong nangungupahan. Ang platform ay hindi kailanman nagtataglay ng hilaw na audio sa labas ng hangganan ng nangungupahan.

[06] · FREE TRIAL // 45 DAYS RISK-FREE SET UP < 1H
Libreng pagsubok

Magsimula sa isang 45-araw libreng pagsubok.

Buksan ang ERP, ikonekta ang isang LINE account, mag-upload ng voice note. Kung hindi nito natipid ang oras ng iyong koponan sa unang linggo, kanselahin anumang oras sa loob ng 45-araw na window at hindi kailanman sisingilin ang card. Kinakailangan ang card sa pag-sign up. Hindi kailangan ng tawag.