IT 뉴스

Google, 음성인식시스템 데이터 세트를 오픈소스로 제공 - 일본서버호스팅 제이피서버

KDSVPN 2017. 8. 28. 10:04
반응형

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

Google은 8월 24일 음성 인식 기능 탑재 응용 프로그램 개발을 위한 기본 음성 명령의 데이터 세트

"Speech Commands Dataset"를 오픈 소스로 공개했다고 발표했다.  일본서버호스팅

공식 블로그의 링크를 클릭하면 압축 파일을 다운로드 할 수있다. 일본서버호스팅

 일본서버호스팅

Speech Commands Dataset은 회사의 기계 학습 라이브러리 "TensorFlow"를 다루는 팀과 인공 지능 (AI)을위한

하드웨어 키트 제공 프로젝트 "AIY (Artificial Intelligence Yourself) Projects" 팀이 공동으로 개발 한 것.

 일본서버호스팅

데이터는 "Yes" "No" "Stop" "Go"등 음성 서비스에서 일반적으로 사용되는 30개의 단어를 수천명의 자원

봉사자가 낭독 한 것으로, 길이 1초 녹음의 6만 5000건이수록 되어있다. 일본서버호스팅

 일본서버호스팅

이 녹음은 AIY가 공개하고 는 Web 사이트를 통해 모아졌다.  일본서버호스팅

이 사이트는 현재도 공개되어 어 누구나 참여할 수있다.  일본서버호스팅

Speech Commands Dataset은 향후 공개 후 녹음 된 데이터가 추가되어 간다. 일본서버호스팅

 일본서버호스팅

Google은 이러한 데이터를 수집하기 한 인프라도 GitHub에서 공개하고있다. 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

회사가 5월에 시작한 AIY Project는 AI 탑재 하드웨어를 자작하는 사람들을 위해 키트를 제공하는 프로젝트.

우선 자연 언어 음성 인식 대화 가제트 "Voice Kit"의 기본 세트를 영미 서점 등을 통해 제공하고있다.

이번에 공개한 데이터 세트는 Voice Kit에도 사용할 수있다. 일본서버호스팅

 일본서버호스팅

Google이나 Facebook 등 음성 서비스를 제공하는 기업은 "Google 길잡이"나 음성 채팅 서비스에서 수집한

사용자의 방대한 음성 데이터를 음성 인식 AI 도구 훈련에 이용할 수 있지만, 소규모 개발자는 이 훈련 데이터를

얻기 어렵다.  일본서버호스팅

이러한 오픈 소스 데이터 세트 공개는 음성 인식 애플리케이션 보급을 지원 할 것 같다.

 일본서버호스팅

같은 프로젝트는 Mozilla도 6월에 "Common Voice"로 시작했다.  일본서버호스팅

이곳은 아직 녹음을 모으고 있는 단계에서 1만 시간 분량의 데이터 수집을 목표로하고있다.

데이터 세트는 연내에 공개 할 전망이다. 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

 일본서버호스팅

반응형