Како направити свој Амазон Ецхо - или нешто слично томе

Building Dynamic Web Apps with Laravel by Eric Ouyang (Јули 2019).

$config[ads_text] not found
Anonim

Сада је доступан развојни комплет који садржи аудио компоненте потребне за креирање гласовног система помоћу Амазон-овог гласовног сервиса

Рицхард Куиннелл, главни уредник

Успех личних помоћника са којим комуницирате преко изговорене речи, као што су Алека, Апплеов Сири и Гоогле Хоме, учинили су гласовном контролу ставку за врућу карту у дизајну система. Међутим, почетак у овој технологији захтијева значајну стручност за обраду звука и сигнала ради рјешавања проблема у позадини шуму и локацији звучника. Нови развојни комплет компаније Мицросеми, у сарадњи са Амазон'с Алека воице сервице (АВС), покушава поједноставити покретање тако да се програмери могу фокусирати на апликацију, а не на имплементацију.

АцуЕдге развојни комплет је полазна тачка за програмера који раде на гласовно активираним системима, али није систем који није у кутији. Комплет садржи развојни модул заснован на Мицросемиовом ЗЛ38063 Тимберволф аудио процесору који је унапред пуњен са софтвером за обраду звука АцуЕдге без лиценце компаније. Постоји и цилиндрични оквир за монтажу за ношење електронике, који много изгледа као скелет Амазон Ецхо. Програмери, међутим, требају снабдевати своје властите Распберри Пи 3 или сличне процесорске плоче по свом избору, на које се развија плоча за развој. Програмерима је потребан и звучник који ће доставити звук из АВС-а. Избор звучника је отворен за програмера, али оквир је димензиониран за преносни звучник ЈБЛ Цлип.

Слика 1: АцуЕдге Алека развојни комплет из Мицросеми-а.

Када се састави хардвер, следећа ствар је потребан за развојног рачунара са Амазон АВС-ом. Међутим, рачун је бесплатан и ужива значајну подршку Амазон за све од техничке обуке до смерница за маркетинг производа. Затим укључите хардвер, инсталирајте софтвер из Мицросеми'с гитхуб-а, покрените Алека сервис и почните разговарати с Алеком.

Развојна табла укључује два микрофона тако да алгоритми за отпуштање еха и формирање сноја у софтверском пакету АцуЕдге омогућавају да се за глас корисника користи 180 ° или 360 ° "слушање". Обликовање снопа може локализовати корисника до прозора од 20 ° да би се одбила бука из вањских извора. Софтвер такође може да подржи пуну дуплекс гласовне интеракције. Овај пуни дуплекс омогућава, између осталог, да систем активно шумира - откачи сопствени аудио излаз тако да може боље реагирати на кориснике који покушавају да разговарају о одговору система.

Уз овај комплет, програмери могу брзо почети да раде на апликацијама које подстичу брз растући интерес потрошача за контролу говора. Према Мицросеми-у, тржиште гласовних система очекује се 75 милиона јединица годишње у року од пет година, а двије трећине од њих су дигитални помоћници попут Ецхо-а. Апликације као што су системи осветљења, уређаји, сет-топ бокес и слично формирају још веће тржиште за функције активације гласа.

Слика 2: Могуће архитектуре за активацију гласа. Извор слике: Мицросеми.

Док је комплет служи као улазна тачка за дизајнирање система који активира глас, он представља само једну од три потенцијалне архитектуре које програмери могу да обављају. Овај систем користи обраду на бази података како би идентификовао буђење, затим шаље додатне аудио податке АВС-у заснованом на облаку за обраду наредби које слиједе. Алтернативна архитектура омогућава уграђивање препознатљивијег реда тако да не постоји веза са облаком да би уређај одговорио на наредбе. Хибридни системи пружају трећу алтернативу, користећи цлоуд везу како би понудили потпуну говорну функционалност са препознавањем основних команди у боку као резервне копије. Процесор Тимберволф може послужити као аудио фронт-енд процесор за било коју од тих архитектура.

Рицхард Куиннелл