Hvert verktøy som transkriberer målretter mot en spesifikk nisje, og Sonix har valgt de som registrerer møter eller presentasjoner og trenger deretter en maskinskrevet versjon for å søke eller spre.
Derfor kan det være like nyttig for en student som det kan være for en utøvende, og levere transkripsjoner som lett kan indekseres for fremtidig referanse.
Men for å lykkes med disse oppgavene, må programvaren være nøyaktig og rimelig.
Er Sonix.ai det verktøyet, og kan en online tjeneste konkurrere med et installert program?
- Vil du prøve Sonix.ai? Sjekk ut hjemmesiden her
(Bildekreditt: Sonix)
Planer og priser
Som med mange transkripsjonstjenester er Sonix kostnadsmodell en som er basert på tid. Spesielt lengden på opptaket du laster opp til tjenesten for å behandle, og kostnadene for den ressursen er $ 10 per time, er at du bruker standard betalingstjenesten.
Kostnaden per time kan settes ned til $ 5 hvis du registrerer deg for Premium-abonnementstjenesten for $ 22 per måned for hver bruker. Og volumrabatter er tilgjengelige for de selskapene som krever mer enn 100 timer per måned transkribert.
Standardplanen har de mest grunnleggende funksjonene, og Premium legger til flere funksjoner som flerbrukertilgang og teamdeling. Og Enterprise har alt Premium tilbyr med mye administrasjon ekstra og en forbedret støttemodell.
Når det gjelder transkripsjonstjenester, er Sonix en av de dyrere, og absolutt ikke noe som flertallet av studenter eller hjemmebrukere rimelig kunne ha råd til.
(Bildekreditt: Sonix)
Design
My.sonix.ai nettstedet bruker en usedvanlig ren design, og å opprette en konto er gratis.
I skrivende stund er dette utelukkende en nettbasert tjeneste, og Sonix har ingen mobilapp for å fange opp og sende til prosessering av lydopptak.
Som vi dekker for sent, er det imidlertid enkle måter rundt dette problemet som løser mangelen på en mobilapp noe.
Utgangspunktet for enhver transkriberende jobb er Sonix.ai-dashbordet, der du kan se lyden som allerede er transkribert og legge til nye som skal behandles..
Fordi dette systemet ble designet for flere brukere, inkluderer det et virtuelt mappesystem for å organisere transkripsjoner på hvilken måte som anses som egnet.
Ved å klikke på «last opp» fører brukeren til en side der flere filer kan slippes i systemet, og hvis kontoen har tilstrekkelig kreditt, kan de behandles.
Alle standard lydfilformatene støttes inkludert wav, mp3, mp4a, aiff, acc, ogg og wma, og du kan også laste opp noen videokollasjestrukturer. Maksimal filstørrelse er 4 GB, så før du laster opp en stor 4K-oppløsning videofil, vil vi anbefale deg å bruke et annet verktøy for å dele opp lyden for å laste opp raskere.
En god måte å fremskynde opplastningen på er å bruke et skylagringsanlegg som Google Drive, One Drive, Box eller Dropbox og koble det direkte til kontoen. Du kan også sende systemet via e-post via Gmail, som et middel til å lage en mer elegant arbeidsflyt enn å slippe filer på en webside.
Denne automatiseringen leveres via Zapier, noe som gir mye større integrasjon hvis virksomheten som bruker den, har investert i denne teknologien for å koble sammen forretningsprosessene..
En annen fin touch er at du sammen med lyd- eller videofilen kan inkludere eksisterende transkripsjon, som et middel til å raskere fullføre prosessen og forbedre nøyaktigheten.
(Bildekreditt: Sonix)
En annen fin touch er at du sammen med lyd- eller videofilen kan inkludere eksisterende transkripsjon, som et middel til å raskere fullføre prosessen og forbedre nøyaktigheten.
På grunn av naturen til skybasert prosessering er det umulig å bedømme hvor rask eller treg prosessering kan være, men Sonix.ai er relativt rask i vår erfaring. Det tar vanligvis mellom 10% og 20% av tiden å transkribere når innspillingen varer. Det tar derfor under 2 minutter å fullføre et 10-minutters opptak.
Du trenger ikke å følge behandlingen, siden systemet vil sende deg et varsel via e-post når arbeidet er gjort, sammen med en lenke til den nye transkripsjonen.
Når filen er behandlet, kan du åpne den på og redigere siden for å se gjennom resultatene, og også eksportere teksten i et bredt spekter av nyttige formater, inkludert de som er definert som teksting av noen apper.
Antall språk og dialekter som støttes av systemet er 36, og det inkluderer flere engelske, franske, kantonesiske, mandarin, portugisiske og spansktalende land, sammen med alle vanlige vestlige og østeuropeiske språk, sammen med noen asiatiske og arabiske språk.
(Bildekreditt: Sonix)
innspillinger
Ved siden av arbeidet som gikk inn i AI som trengs for å tolke støyene som mennesker lager, representerer antagelig Innspillingssiden en betydelig kodingsinnsats her.
Her kan både lyden og den tilhørende transkripsjonen sammenlignes og forbedres manuelt med detaljer om høyttalerendringer og fikser til feiltolkninger.
For alle som jobber gjennom en transkripsjon for å polere teksten, gir denne siden kullens beliggenhet. Det er fornuftig at det har gått litt inn på denne delen, siden det er veldig enkelt å bruke og følge.
I et forsøk på å rette brukeren om hvor det kan være problemer, vil Sonix.ai fargelegge innholdet for å fremheve de seksjonene som det er mindre selvsikker. Denne funksjonen kan være nyttig, selv om Sonix.ai kan gjøre feil i til og med de delene der den anser at transkripsjonen har en ‘veldig selvsikker’ status.
De beste aspektene ved denne siden er hvordan lydavspillingen og teksten synkroniseres slik at plassering av markøren i teksten flytter avspillingsposisjonen til samme seksjon.
Ved siden av vanlig redigering er det også mulig å fremheve seksjoner i forskjellige stiler og lage notater for å gå langs transkripsjonen.
Du kan også finpusse tidskoden, spesielt nyttig hvis innspillingen starter med en lang pause eller uønsket innledning.
(Bildekreditt: Sonix)
nøyaktighet
Sonix beskriver Sonix.ai som ‘Den beste automatiserte transkripsjonsprogramvaren drevet av banebrytende AI’.
Med tanke på testen vår, vil vi beskrive dette produktet som veldig avhengig av kvaliteten på innspillingen og mange andre faktorer som ikke lett kan kontrolleres.
Når vi behandlet våre klassiske historiske taleopptak, hadde det virkelig vanskelig med noen foredragsholdere, selv om de hørtes tydelige ut for oss.
Disse resultatene sto i markant kontrast til noen mer samtidig innspillinger, der nøyaktigheten var akseptabel, men neppe fantastisk.
Vi konkluderte med at tilnærmingen tatt av Sonix gjør flere antagelser som kan fungere eller ikke, avhengig av høyttaler og kvaliteten på innspillingen.
Det som var fascinerende er at tjenesten vil fargekode transkripsjonen sin basert på hvor trygg den er på det som blir sagt, og denne selvanalysen er veldig avslørende.
Under noen omstendigheter vil den korrekt identifisere at en seksjon kan være mistenkt, men i andre deler er den trygg på at seksjonen den transkriberes helt galt.
Noen få vanlige problemer ser ut til å kaste en kurveball, og en av disse er mennesker som ikke snakker grammatisk perfekt prosa. I et forsøk på å gjøre talen deres mer direkte, har de fjernet noen ord fra setningene, noe som gir en mer dramatisk stil. Når disse blir transkribert av Sonix, ser det ut til å være bestemt på å legge disse ordene tilbake for å passe til den interne grammatikkmodellen, i stedet for det som egentlig ble talt.
Transkripsjonen leser bedre som et dokument, men den er ikke virkelig representativ for det som ble sagt.
Sonix er absolutt bedre når kvaliteten på innspillingen og klarheten til høyttaleren er høy, slik vi beviste med et lite klipp av Stephen Fry som leste Harry Potter. Men det er ikke mulig å alltid ha slik kontroll over lydkvaliteten, og det gjorde fremdeles feil med den testen.
Et annet problemområde er formelle navn og tekniske ord eller forkortelser. Disse kan adresseres ved å legge dem til i den tilpassede ordboken, men dette krever arbeid for å gjøre systemet i stand til å realisere seg bedre når navn eller akronymer brukes.
For de som trenger perfeksjonering av transkripsjon, har Sonix et utvalg tilknyttede profesjonelle transkripsere som kan jobbe gjennom en registrering og løse disse problemene, men dette beseirer formålet med prosessert transkripsjon..
(Bildekreditt: Sonix)
Sikkerhet
Fokus for Sonix.ai sikkerhet er serverne der lyden blir behandlet, og transkripsjonene blir holdt.
All trafikk er kryptert ved bruk av TLS (Transport Layer Security), og når filene en gang er på serveren som er beskyttet av flere lag brannmur, blir inntrengningsbeskyttelse og alle data ringfensiert av AES-256-kryptering på serversiden. Og selskapet lover at ansatte ikke har tilgang til opptak eller transkripsjoner med mindre eksplisitt tillatelse er gitt for dem å ha det.
Det kritiske problemet med denne tilnærmingen er at en enkel innlogging og passord kan omgå alt. Sonix.ai har ingen tofaktorautentisering, og den har ikke en lett tilgjengelig logg over hvem som får tilgang til filer og når.
Fra et sikkerhetssynspunkt kan dette godt betraktes som en overdreven avhengighet av integriteten til de som bruker systemet for ikke å dele opptak med andre utenfor virksomheten eller beholde potensielt sensitive filer når de forlater selskapet..
Kort sagt, sikkerheten må være bedre, og sporings- eller brukeraktiviteten prioriteres større.
Endelig dom
Tatt i betraktning de relativt høye kostnadene, forventet vi at Sonix ville prestere bedre enn det gjorde.
Kanskje var vi uheldige med valgene våre om å transkode, men det så ut til å gjøre en overdreven mengde feil.
På plussiden av denne ligningen er det raskt, og det er et bemerkelsesverdig enkelt system å bruke, selv om vi vil anbefale å kjøre noen eksempler på opptak gjennom denne løsningen før du går inn på et abonnement.
Det største problemet med Sonix er de høye kostnadene, og selv om det er det riktige verktøyet for akkurat ditt behov, er det billigere måter å gjøre lyd om til tekst andre steder.