'MachineLearning' 태그의 글 목록

[이슈관리] Unity에서 Google Speech API Asset의 C# Script 고치기

CS/졸업 프로젝트(Duk to Me) 2023. 6. 26. 07:04

상황 Unity와 연결하여 사용 중인 Google Speech API Asset(https://assetstore.unity.com/packages/tools/ai-integration/speech-recognition-using-google-cloud-vr-ar-mobile-desktop-pro-72625)에서 제공하는 C# Script에서 인식된 음성을 특정 텍스트와 비교하여 Matched 결과를 알 수 있도록 RecognizeSuccessEventHandler를 수정하려고 한다. private void RecognizeSuccessEventHandler(RecognitionResponse recognitionResponse) { string transcript = recognitionRespons..

[이슈관리] Google Cloud Text-to-Speech(TTS) API, 목소리 성별 바꾸기

CS/졸업 프로젝트(Duk to Me) 2023. 6. 26. 05:58

상황 지난번에 설정했던 Google TTS Python 코드에서는 성별이 중성으로 밖에 출력이 안되었다. # Build the voice request, select the language code ("en-US") and the ssml # voice gender ("neutral") voice = texttospeech.VoiceSelectionParams( language_code="en-US", ssml_gender=texttospeech.SsmlVoiceGender.NEUTRAL 위 코드에서 'NEUTRAL'을 아무리 'FEMALE', 'MALE'로 바꾸어도 먹히지 않았다. 해결 공식문서에서 제공하는 이미 정의되어 있는 목소리 설정(https://cloud.google.com/text-to-..

Google Cloud Text-to-Speech(TTS) API, Python으로 사용하기

CS/졸업 프로젝트(Duk to Me) 2023. 6. 20. 02:23

이미 Speech-to-Text API사용을 위해 만들어 둔 Project를 그대로 사용할 거다. ① Google Cloud Console창(https://console.cloud.google.com/welcome/new?project=thorn-technologies-public)에서 지난 번에 생성한 Project를 Select한다. ② Library에 들어가 검색창에서 'text to speech'를 검색하여 Enable한다. 나머지 Service Account, API Key 받아오기 등과 같은 설정들은 Speech-to-Text API 설정 때 했던 것 그대로 쓰면 된다. ③ 터미널 창에서 Python 가상환경 폴더 경로로 들어가서 가상환경을 활성화 시킨다. cd Scripts activate...

Google Cloud Speech-to-Text(STT) API 초기설정및 Python으로 사용하기

CS/졸업 프로젝트(Duk to Me) 2023. 6. 20. 01:26

Python으로 Speech-to-Text API를 사용할 예정이기 때문에 Local 환경에 Python이 설치되어 있어야 하고, Python 가상환경을 만들어 작업할 것이다. ¶ Python 가상환경 만들기 ① Local에 Python이 설치되어 있는지 확인하기 위해 터미널 창에 명령어 입력하기 python --version 설치되어 있다면 Python 버전이 잘 출력될 것이다. ② Python 가상환경을 만들 작업 폴더로 경로 이동하여 가상환경 생성하기 python -m venv [venv_name] (대괄호 안에는 가상환경 이름을 설정, 실습에서는 'speech_to_text_demo'로 설정) 해당 경로에 가상환경 이름으로 된 폴더가 만들어지면 성공. ③ 가상환경 폴더로 이동하여 가상환경 활성화시..

Google Cloud Speech API 개념및 기능 설명

CS/졸업 프로젝트(Duk to Me) 2023. 6. 19. 19:34

Google Cloud Speech API는 Google의 머신러닝 신경망 기술을 활용하여 음성을 텍스트로 또는 텍스트를 음성으로 변환하는 기능을 제공한다. 딥러닝 알고리즘을 사용하여 다양한 음성 언어와 방언을 지원하며, 대량의 음성 데이터를 학습하여 높은 정확도를 제공한다. 또한, 간단한 API 호출을 통해 손쉽게 음성 처리 기능을 구현할 수 있어 다양한 음성 기반 애플리케이션 개발에 활용할 수 있다. ⓐ Speech-to-Text (https://cloud.google.com/speech-to-text?hl=ko) Speech-to-Text API는 음성을 텍스트로 변환하는 강력하고 정확한 클라우드 기반 서비스이다. Speech-to-Text에는 음성인식을 수행하는 세가지 주요 방법이 있다. 1) 동..

ABOUT ME

Logbook Logbook

티스토리툴바