Watson tale til tekstanmeldelse: Den beste transkripsjonsservicen med høyt volum? anmeldelse

Watson er IBMs datamaskinsystem for naturlig språkbehandling. Den gir den berømte spørsmålssvarende superdatamaskinen så vel som en serie AI-baserte bedriftsprodukter, inkludert Watson Speech to Text. I vår Watson Speech to Text-gjennomgang tar vi en titt på en av de beste tale-til-tekst-appene rundt, ideell for alle som ønsker å konvertere lyd til tekst i stor skala.

Watson talebehandlingsplattform er tilgjengelig på IBM Cloud. Det er et allsidig verktøy og kan brukes i mange sammenhenger, inkludert diktering og transkripsjon for konferansesamtaler. I motsetning til de fleste andre tale-til-tekst-apper, er den tilgjengelig som et API, slik at utviklere kan legge dem inn i stemmestyringssystemer, blant annet.

Watson tale til tekst: Planer og priser

Du kan bruke Watson Speech to Text til å behandle opptil 500 minutter lyd gratis per måned. Hvis du vil konvertere mer enn det, må du betale for hvert lydminutt, og hastigheten endres basert på varigheten på behandlet lyd. Kostnadene varierer fra $ 0,01 til $ 0,02 per minutt, og det koster en tilleggsavgift på $ 0,03 per minutt hvis du trenger IBMs tilpassede språkmodell. Premium-tilbud bare for Watson-planer er tilgjengelige, og disse gir tilgang til forbedrede datasikkerhetsfunksjoner og oppetidsgarantier.

Watsons tale-til-tekst-tjeneste er priset basert på volumet av innhold du trenger å transkribere. (Bildekreditt: IBM)

Du kan også få tilgang til Watson Speech to Text-systemet gjennom et generelt IBM Cloud-abonnement. Naturlig språkbehandling er bare en app i et bredt spekter av AI-tjenester du kan få gjennom IBM Cloud, så dette er et godt alternativ for enhver organisasjon som trenger tilgang til høyhastighets dataoverføring, chatbots eller tekst-til-tale-verktøy.

Watson tale til tekst: funksjoner

Takket være fleksibel API-integrasjon og andre pre-build IBM-verktøy går Watson talegjenkjenningstjeneste langt utover grunnleggende transkripsjon. Hvis du for eksempel vil bruke den i en kundeservicesammenheng, kan Watson Assistant settes opp for å behandle naturlige språkspørsmål direkte eller svare på spørsmål via telefon.

I Watson har IBM satt sammen en funksjonsrik prosesseringsplattform for naturlig språk. (Bildekreditt: IBM)

Watson jobber med live lyd på 11 språk og kan importere lyder i en rekke forhåndsinnspilte formater. Ved strømming betyr sanntidsdiagnostisk støtte Watson kan be brukerne om å komme nærmere mikrofonen sin eller endre miljøet. Også imponerende er det faktum at Watson kan skille mellom forskjellige høyttalere i en delt samtale takket være Speaker Diarization, en funksjon som fortsatt gjennomgår betatesting.

Watson tale til tekst: Oppsett

For å bruke Watson er det første du må gjøre å opprette en IBM Bluemix-konto. Registrering er gratis og smertefri, og krever bare en e-postadresse og passord. Når du er logget inn, må du legge til en bestemmelse på kontoen din for tjenesten for tale til tekst. Du vil få et par legitimasjonsbeskrivelser på dette stadiet som du bør lagre i dine egne poster.

Det er nødvendig å registrere en IBM Bluemix-konto for å få tilgang til Watsons fulle funksjonssett. (Bildekreditt: IBM)

Etter at du har gjort det, blir ting betydelig mer komplekse. For å få tilgang til Watson, må du legge til legitimasjonene i en gruppe klientens enhetlige ressurslokator (cURL) -koder og deretter kjøre den på maskinen din. For å finne ut nøyaktig hvilken kommando du skal ringe, sjekk ut denne nyttige guiden. Alternativt, hvis du bare vil se hvor bra Watson-systemet fungerer uten å måtte hoppe gjennom alle disse bøylene, kan du prøve det på IBMs demoside i stedet.

Watson tale til tekst: grensesnitt

I motsetning til forbrukervendte tale-til-tekst-apper, er Watsons tjenester designet for å få tilgang via APIer og kode innebygd i andre systemer. Av denne grunn er det ingen ekte Watson “grensesnitt”. I stedet kan du få tilgang til Watson gjennom tre forskjellige internettprotokoller. Dette er WebSockets, REST API og Watson Developer Cloud.

Watson Speech to Text kan styres gjennom Watson Developer Cloud-system. (Bildekreditt: IBM)

For å kontrollere Watson, må du bruke et kommandolinjeverktøy som kobles til IBMs sky via en av de tre rutene. Grensesnittet som sluttbrukeren som samhandler med Watson ser, må bygges av noen i ditt utviklingsteam separat.

Watson tale til tekst: ytelse

Totalt sett ble vi imponert over måten denne plattformen for naturlig språkbehandling håndterte ekte tale på. Vi brukte Watson til å transkribere klipp vi spilte inn i en rekke utfordrende miljøer, samt lydbiter av kjente taler gitt på flere av Watsons 11 støttede språk.

Vi fant at Watson presterte bra med forhåndsinnspilt tale. (Bildekreditt: IBM)

Selv om feil vokste hyppigere for klipp med mye bakgrunnsstøy, ga Watson generelt generelle nøyaktige resultater. Vi tester fra testene våre at uforpliktede feil bare skjedde hver 150. ord i gjennomsnitt. Imidlertid ble det klart hvorfor Watsons funksjon for høyttalerdiarisering fortsatt er i BETA-testing, ettersom en stemme flere ganger under vår evaluering var feilmerket som separate høyttalere.

Watson tale til tekst: support

IBMs ressurssenter tilbyr rikelig med dokumentasjon for å bedre forstå hvordan du bruker Watson i din spesielle brukssak. Det er også verdt å benytte seg av API-integrasjoner og SDK-er som er opprettet av Watson-utviklermiljøet og lagt ut til GitHub.

Watson API GitHub-siden er en god kilde til støtte for Watson Speech to Text-tjenesten. (Bildekreditt: IBM)

Hvis du ikke finner løsningen på problemet ditt der, kan du kontakte IBM direkte ved å åpne en supportbillett eller kontakte dem via telefon. Så lenge du valgte en av premium Watson-pakker, vil din Watson-bruk være beskyttet av en Service Level Uptime-avtale.

Watson tale til tekst: endelig dom

Hvis organisasjonen din har kunnskap og ressurser for å riktig integrere IBM Watson Speech to Text-plattformen i systemet ditt, vil du dra nytte av avanserte funksjoner som sanntids lydmiljødiagnostikk og mellomliggende transkripsjonsresultater. Imidlertid vil små bedrifter og organisasjoner slite med den tekniske utfordringen med å sette opp Watson ordentlig.

Konkurransen

IBM Watson Speech to Text-tjenesten er en direkte konkurrent til bulktranskripsjonstjenester Google Cloud Speech-to-Text og Amazon Transcribe. Begge disse er vesentlig billigere enn Watson, med for eksempel Google Cloud-transkripsjon som starter på $ 0,006 per minutt. Alle tre tjenestene har lignende funksjoner, for eksempel tilpasset ordforråd, men en funksjon som savnes sårt fra IBM Watson, men tilgjengelig med begge konkurrenter, er automatisk tegnsettinggjenkjenning.

Leter du etter en annen tale-til-tekst-løsning? Sjekk ut vår beste programvareveiledning for tale til tekst.