Cybertronian text translator

5/19/2023

Paraphrase-multilingual-MiniLM-L12-v2 - Multilingual version of paraphrase-MiniLM-L12-v2, trained on parallel data for 50+ languages. This version supports 50+ languages, but performs a bit weaker than the v1 model. Supports 15 languages: Arabic, Chinese, Dutch, English, French, German, Italian, Korean, Polish, Portuguese, Russian, Spanish, Turkish.ĭistiluse-base-multilingual-cased-v2: Multilingual knowledge distilled version of multilingual Universal Sentence Encoder. These models find semantically similar sentences within one language or across languages:ĭistiluse-base-multilingual-cased-v1: Multilingual knowledge distilled version of multilingual Universal Sentence Encoder. We used the following 50+ languages: ar, bg, ca, cs, da, de, el, en, es, et, fa, fi, fr, fr-ca, gl, gu, he, hi, hr, hu, hy, id, it, ja, ka, ko, ku, lt, lv, mk, mn, mr, ms, my, nb, nl, pl, pt, pt-br, ro, ru, sk, sl, sq, sr, sv, th, tr, uk, ur, vi, zh-cn, zh-tw. Details are in our publication Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation. You do not need to specify the input language. The following models generate aligned vector spaces, i.e., similar inputs in different languages are mapped close in vector space.

0 Comments

Cybertronian text translator

Leave a Reply.

Author

Archives

Categories