본문 바로가기

728x90
반응형

스터디

(24)
"Robust Speech Recognition via Large-Scale Weak Supervision", OpenAI ChatGPT를 공개해서 엄청난 관심을 받은 OpenAI에서 내놓은 multi-task, multi-language 음성인식 기술. https://openai.com/blog/whisper/ Introducing Whisper We’ve trained and are open-sourcing a neural net called Whisper that approaches human level robustness and accuracy on English speech recognition. Read Paper View Code View Model Card Whisper examples: Reveal Transcript Whisper is an automatic speech rec openai.com 전체 구조..
"STREAMING, FAST AND ACCURATE ON-DEVICE INVERSE TEXT NORMALIZATION FOR AUTOMATIC SPEECH RECOGNITION", Microsoft 내용 요약 on-device streaming에서도 사용가능한 가벼운 ITN 방법 제안. tagging : streaming 인식결과들을 chunk-based transformer tagger로 실시간 태깅 ITN 카테고리가 뭔지만 태깅 chunk size가 작으면 latency가 적은 대신 정확도가 떨어질 수 있음 transduction : 문장에서 태깅된 부분만 ITN-category-specific WFST로 변환 실험 모델구조 ASR: Transformer transducer(transformer 24 blocks) Tagger: Transformer tagger(transformer 6 blocks) cross entropy loss 이용해서 19개의 tag 중 하나를 예측 학습데이터는 다양한 ..
[medium] 200. Number of Islands 문제 https://leetcode.com/problems/number-of-islands/ Number of Islands - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com 풀이방법 섬 개수를 세는 유명한 BFS 문제. M*N 배열을 탐색하면서 중복 방문을 허용하지 않도록 하면 된다. 붙어있는 land를 체크하기 위해서 좌,우,위,아래의 이웃한 셀들을 체크한다 grid[row][col]=="0" 인 경우, 해당 셀은 water를 뜻하므로 체크할 필요 없다 vi..
[medium] 869. Reordered Power of 2 문제 https://leetcode.com/problems/reordered-power-of-2/ Reordered Power of 2 - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com 풀이방법 문제는 간단한데 풀이방법이 딱 떠오르지 않아서 다른 사람들의 풀이를 참고했다. n을 나누거나 하는 방식으로 접근하는게 아니라 n의 범위가 1이상 10^9 이하에 초점을 맞춰야 했다. 주어진 n의 범위에 해당하는 2의 제곱수는 2^0, 2^1, ..., 2^31 이므로 이..
[easy] 13. Roman to Integer 문제 https://leetcode.com/problems/roman-to-integer/ Roman to Integer - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com 풀이방법 로마숫자를 변환하는 문제이다. "IV" 와 "VI" 처럼 "I"가 "V"보다 앞에 나왔는지 뒤에 나왔는지에 따라서 -가 될지 +가 될지가 달라지는데, 이를 고려해야 한다. 그래서 prev와 prevcnt로 이전에 나온 심볼의 종류와 횟수를 저장했다가, cur에서 새로운 심볼이 나올때 ..
[앱개발] 랜덤 메뉴 추천 어플 친구들이랑 공부할겸 만들어본 랜덤 메뉴추천 어플. 메뉴 정하는걸 오늘의 운명에 맡긴다 해서 ‘먹다 + 사주팔자 => 먹주팔자’ 로 이름 지었다. https://play.google.com/store/apps/details?id=jkl.random_menu&hl=ko&gl=US 랜덤메뉴: 오늘의 먹주팔자 - Google Play 앱 고민되는 메뉴 리스트 중 하나를 랜덤으로 골라드립니다. play.google.com 기능은 크게 1. 리스트에 있는 메뉴들 중에 하나를 랜덤으로 보여주기 (리스트의 항목은 사용자가 추가도 가능) 2. 선택된 메뉴를 지도에서 검색하기 정도로 간단하게 만들어봤다. 개발은 flutter로 했는데 처음 해보는거다보니 dart 코딩 자체도 이해하는데 시간이 걸렸고, 광고 붙이고 앱 배포..
[hard] 30. Substring with Concatenation of All Words 문제 https://leetcode.com/problems/substring-with-concatenation-of-all-words/ Substring with Concatenation of All Words - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com 풀이방법 silding window 방법으로 시도했으나 접근방법이 잘못되서 계속 예외케이스들이 나와서 실패. 결국 다른사람 풀이 보고 이해해서 풀었다. words의 단어들의 길이는 모두 동일하고, word..
[medium] 98. Validate Binary Search Tree 문제 https://leetcode.com/problems/validate-binary-search-tree/ Validate Binary Search Tree - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com 풀이방법 root부터 시작해서 최소값, 최대값을 저장하면서 children이 범위 내에 있는지 확인하면 되는 문제이다. right children을 탐색할 때는 최대값을 업데이트하고, left children을 탐색하다가 최소값을 업데이트 한다. 최소값,..

728x90
반응형