-
Notifications
You must be signed in to change notification settings - Fork 0
/
QnA.txt
32 lines (24 loc) · 1.64 KB
/
QnA.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
질문
--------------
- 음성 이론 부분
--------------
! 소리의 주파수와 파동은 다른개념입니다.
-> 주파수와 파동이 어떻게 다른지 설명이 가능하신가요?
! 파동의 어떤 부분을 사용해서 퓨리에 함수를 사용하는 것보다 더 좋아지는 지 설명가능한가요?
-> 음압(sound pressure)을 예측하여 (16000개로 쪼갠 음압, 0.025초) 추론한다.
음압 이론에 대해서는 https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=hearmall&logNo=220957997531 참고
--------------
- 모델 이론 부분
--------------
! 훈련하는데, 컴퓨터 자원이 모자른 경우 어떻게 대처를 했나요?
-> 데이터 셋을 1000개의 음성 파일 단위로 소분하여 조금씩 train하였으며, batch 수치도 기본 수치에서 절반(16 -> 8)로 조정하였습니다.
-> cuda 메모리를 리셋하여 다음 데이터셋을 읽을 때, 메모리를 확보하였습니다.
!심스펠 알고리즘이 무엇인가요?
-> Peter Norving 알고리즘은 연산비용이 높기 중국어 같은 언어에서는 활용할 수 없다는 한계점이 있다. ( 글자를 표현하는 유니코드의 종류가 다양하기 때문에 후보군을 모두 계산하기 어렵다. )
Symspell 알고리즘은 Peter Norving 알고리즘의 단점을 보강한 알고리즘
--------------
- 클라이언트 부분
--------------
클라이언트 제작에 pyqt를 선택한 이유는?
python으로 작성된 AI 모델과 언어가 같기 때문에 연동하기 쉬울 것으로 기대하였으며,
실제로 빠른 시간내에 클라이언트를 연동할 수 있었습니다.