conda create -n env_name --python=3.10
conda activate env_name
pip install -r requirements.txt
python main.py
python ./test/test.py [--file ./test/companies_test.csv ]
• Precision (точность) - доля объектов, названных классификатором положительными и при этом действительно являющимися положительными.
• Recall (полнота) - доля объектов положительного класса, найденных классификатором, из всех объектов положительного класса.
• F-мера - гармоническое среднее между точностью и полнотой. Она стремится к нулю, если точность или полнота стремится к нулю.
hyperparameters | value |
---|---|
Batch Size | classifier: 16, embedder: 32 |
Epochs | classifier: 1, embedder: 1 |
Optimizer | torch.optim.AdamW(lr=1e-4, eps=1e-6) |
Warmup Steps | 5% batches ~ 1k |
Scheduler | WarmupLinear |
• Сравение методов поиска
method | speed |
---|---|
kNN | 230ms |
Approximate NN | 180ms |
• Тестовые метрики
Precission | Recall | F-мера |
---|---|---|
0.98 | 0.18 | 0.31 |