-
Project Period: 2022.04.07 ~ 2022.06.10
-
Project Presentation Video: Link to YouTube
-
Project Presentation File: CV_16แแ ฉ_แแ กแฏแแ ฃแจแแ ฎแซแ แ ฒ_แแ ฌแแ ฉแผแแ ณแ แ ฉแแ ฆแจแแ ณ แแ กแฏแแ ญแแ กแ แ ญ.pdf
-
Project Wrap-up Report: ์ต์ข ํ๋ก์ ํธ_CV_16_Wrap UP Report.pdf
- Metric Learning์ ํ์ฉํ Reverse Pill Image Search
- streamlit ์คํ ์์
๊ถ์ํธ | ์๋ค๋น | ์์ํ | ์ด์์ค | ์ ๊ฒฝ๋ฏผ |
---|---|---|---|---|
- ๊ถ์ํธ: FastAPI, BentoML, streamlit, GCP, OCR, Text Recognition
- ์๋ค๋น: FastAPI, streamlit, OCR, Text Recognition
- ์์ํ: Data EDA, Data Pre-processing, Image Classification, Custom Dataset Production
- ์ด์์ค: Metric learning, Segmentation, Database, Docker
- ์ ๊ฒฝ๋ฏผ: Data EDA, Data Pre-processing, Data Annotation, OCR, Text Recognition
- ์ฌ์ฉ์์ ์์ฝ ์ด๋ฏธ์ง๋ก๋ถํฐ ์์ฝ์ ์๋ณํ๋ ์ธ๊ณต์ง๋ฅ ์๋น์ค
- ์ฌ์ฉ์์ ์์ฝ ์ด๋ฏธ์ง๋ก๋ถํฐ ์ฑ์, ์ ํ, ์์์ ์๋ณ ํ ์กฐ๊ฑด์ ๋ง๋ ์์ฝ์ ๊ฒ์ํ์ฌ ์์ฝ์ ์ข ๋ฅ๋ฅผ ์๋ณํ๋ค.
- ์ง๋ฆฌ์ , ๋ฌผ๋ฆฌ์ ํ๊ณ๋ก ์ฝ๊ตญ์ด๋ ๋ณ์์ ๋ฐฉ๋ฌธํ๊ธฐ ์ด๋ ค์ด ์ฌ๋
- ์์ฝ์ ์์ง๋ง ์์ฝ์ ๊ตฌ๋ถํ ์ ์๋ ์ฌ๋
- ์ข ์ข ์ผ์ด๋๋ ์ฒ๋ฐฉ ์ค์, ๋ฐ ์ฐฉ๊ฐ์ผ๋ก ์ธํ ์ฝ๋ฌผ์ฌ๊ณ ๋ฅผ ์๋ฐฉํ๊ณ ์ ํ์๋ค.
- ์ค์ ๋ณด๊ฑด ๊ณ์ด ์ข ์ฌ์์ ๋ฐ๋ฅด๋ฉด ๋ ธ๋ ์ธต์ ๊ฒฝ์ฐ ์ด๋ค ์์ฝ์ธ์ง ๋ณ์์ ๋ฐฉ๋ฌธํ์ฌ ์์ฝ์ ์ฐพ๋ ๊ฒฝ์ฐ๊ฐ ์กด์ฌํ๋ค๊ณ ํ๋ฉฐ, ํ๊ตญ์ ํต๊ณ๋ฅผ ๋ณด์์ ๋๋ ์ฝ๋ฌผ ์ค๋ณต์ฉ์ ์ํ ์ฌ๊ณ ๋ ์ค์ง ์๊ณ ๊ณ์ ์ ์ง๋๊ณ ์๋ ์ถ์ธ์ด๋ค.
- ์์ฝํ ์์ ๋๋ผ ๋ฐ์ดํฐ (Link)
- ePillID Benchmark (Link)
- ๊ธฐํ ์ด๋ฏธ์ง ๋ฐ์ดํฐ (Link)
- Classification ๋ฐ Object Detection์ ์ํด ์ง์ ์ดฌ์ ๋ฐ ์์งํ, ๋ผ์ด์ผ์ค๊ฐ ์๋ ์ด๋ฏธ์ง๋ค
- GPU: Tesla V100
- OS: Ubuntu 18.04.5LTS
- CPU: Intel Xeon
- Python : 3.8.5 / 3.9.13
final-project-level3-cv-16
โโ api_folder
โ โโ .streamlit
| | โโ config.toml
โ โโ backend
| | โโ epillid_benchmark(cloned from Link)
| | โโ Dockerfile
| | โโ Backend.py
| | โโ requirements.txt
โ โโ frontend
| | โโ Dockerfile
| | โโ frontend.py
| | โโ requirements.txt
โ โโ Docker
| โโ docker-compose.yml
โโ image_classification
โโ data_preprocessing
| โโ download_pill_data.py
| โโ normalize_pill_data.py
โโ image_concatenation
| โโ concatenation_images.py
โโ kaggle_pill_data_preprocessing
| โโ 1_annotation_file_name_to_txt.py
| โโ 2_edit_xml_path.py
| โโ 3_xml_to_json.py
โโ pill_excel_data
| โโ README.md
โโ .gitignore
โโ data.py
โโ dataset.py
โโ log.py
โโ train.py
- Top-1 accuracy: 43%
- Top-5 accuracy: 80%
- ๋ชจ๋ธ์ ์ ํ๋ ํฅ์ ๋ฐ inference time ๋จ์ถ
- Mobile Application ์ ์
- ์ค์ฉ์ฑ ํฅ์
- OCR ์ ์ฉ
๐ย Experiments & Submission Report
- ePillID Dataset: A Low-Shot Fine-Grained Benchmark for Pill Identification (Link)
- YOLACT: Real-time Instance Segmentation (Link)
- How to make deep-text-recognition-benchmark model to recognize both Korean and English (Link)
- OCR Model (Link)
- Jaccard Similarity (Link)
- Text-Recognition Model (Link)
- Background-Removal program (Link)
- Object Detection model YOLOv5 (Link)
- timm (Link)