🗃️ Корпус

100k+ слов с российских новостных сайтов (2020–2025)

⚙️ Параметры

  • Алгоритм: Doc2Vec PV-DM
  • Размерность: 100
  • Размер окна: 5
  • Min frequency: 5

📊 Метрики

  • Semantic similarity correlation: 0.97

💻 Пример использования

from gensim.models import Doc2Vec
model = Doc2Vec.load("Shu-vi/Russian-News-Doc2Vec-PV-DM-100D")
vector = model.infer_vector("Путин посетил конференцию".split())
print(model.dv.most_similar([vector]))
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support