Les premiers pas
fastText est une bibliothèque permettant un apprentissage efficace des représentations de mots et de la classification des phrases.
Prérequis
fastText s'appuie sur les distributions Mac OS et Linux modernes. Exploitant les fonctionnalités de C++11, il nécessite un compilateur prenant en charge C++11. Parmi ces fonctionnalités, on trouve :
- (gcc-4.6.3 ou plus récent) ou (clang-3.3 ou plus récent)
La compilation s'effectue à l'aide d'un Makefile; vous aurez donc besoin d'un Makefile fonctionnel. Pour le script d'évaluation de similarité de mots, vous aurez besoin de :
Construire fastText comme outil en ligne de commande
Pour construire fastText, utilisez la commande suivante :
|
$ git clone https://github.com/facebookresearch/fastText.git $ cd fastText $ make |
Cela produira des fichiers objets pour toutes les classes, ainsi que le fichier binaire fasttext principal. Si vous ne prévoyez pas d'utiliser le compilateur système par défaut, mettez à jour les deux macros définies au début du Makefile (CC et INCLUDES).
Construction du module fasttext Python
Pour construire le module fasttext pour Python, utilisez la commande suivante :
|
$ git clone https://github.com/facebookresearch/fastText.git $ cd fastText $ sudo pip install . $ # ou : $ sudo python setup.py install |
Vérifiez ensuite que l'installation s'est bien déroulée :
|
$ python Python 2.7.15 |(default, May 1 2018, 18:37:05) Type "help", "copyright", "credits" or "license" for more information. >>> import fasttext >>> |
Si vous ne voyez aucun message d'erreur, l'installation a réussi.