白金鉱業.FM番組内の類似エピソードを検索できます。
https://share.streamlit.io/ysdyt/shirokanefm_search/main/shirokanefm_similarity.py
ざっくりと、やり方は以下です。
- Amazon Transcribeでmp3音源を文字起こし
- 文字起こししたテキスト中の名詞や固有名詞を抽出
- 抽出した語からエピソード間の類似度を計算
- 類似度が高い順に表示 (=類似エピソード検索機能)
- 一定の類似度以上のエピソードペアを抽出してネットワークとして可視化(=エピソードネットワーク)
- 計算結果データをstreamlitでGUIを付けて、streamlit Cloudでホスティングしています。