Section courante

A propos

Section administrative du site

Voici les différentes manières d'installer spacCy.

pip

En utilisant pip, les versions de spaCy sont disponibles sous forme de paquets sources et de wheel en binaires (à partir de la version 2.0.13). Pour les versions les plus récentes, pip 19.3 ou plus récent est recommandé.

pip install -U pip setuptools wheel
pip install -U spacy

Pour installer des tables de données supplémentaires pour la lemmatisation dans spaCy v2.2+, vous pouvez exécuter pip install spacy[lookups] ou installer spacy-lookups-data séparément. Le paquet de recherche est nécessaire pour créer des modèles vierges avec des données de lemmatisation et pour lemmatiser dans des langages n'étant pas encore fournis avec des modèles pré-entraînés et n'étant pas alimentés par des bibliothèques tierces. Lors de l'utilisation de pip, il est généralement recommandé d'installer les paquets dans un environnement virtuel pour éviter de modifier l'état du système de la manière suivante :

python -m venv .env
source .env/bin/activate
pip install -U pip setuptools wheel
pip install spacy

conda

Vous pouvez installer spaCy via conda-forge avec la commande suivante :

conda install -c conda-forge spacy

Mise à niveau de spaCy

Bien que les développeurs essaie de réduire au minimum les modifications apportées, la mise à niveau de spaCy v1.x vers v2.x peut nécessiter des modifications de votre base de code. Lors de la mise à jour vers une version plus récente de spaCy, il est généralement recommandé de commencer avec un environnement virtuel propre. Si vous effectuez une mise à niveau vers une nouvelle version majeure, assurez-vous que les derniers modèles compatibles sont installés et qu'il ne reste plus d'anciens liens de raccourci ou de paquets de modèles incompatibles dans votre environnement, car cela peut souvent entraîner des résultats inattendus et des erreurs. Si vous avez formé vos propres modèles, gardez à l'esprit que vos entrées d'entraînement et d'exécution doivent correspondre. Cette situation signifie que vous devrez recycler vos modèles avec la nouvelle version. Depuis la version 2.0, spaCy fournit également une commande de validation, vous permettant de vérifier que tous les modèles installés sont compatibles avec votre version de spaCy. Si des modèles incompatibles sont détectés, des conseils et des instructions d'installation sont affichés. La commande est également utile pour détecter les liens de modèle désynchronisés résultant de liens créés dans différents environnements virtuels. Il est recommandé d'exécuter la commande avec python -m pour vous assurer que vous exécutez la bonne version de spaCy.

pip install -U spacy
python -m spacy validate

Exécuter spaCy avec GPU

Depuis la version 2.0, spaCy est fourni avec des modèles de réseaux neuronaux étant mise en oeuvres dans une bibliothèque d'apprentissage automatique, nommé Thinc. Pour la prise en charge des GPU, il faut utiliser le travail du module CuPy de Chainer, fournissant une interface compatible numpy pour les tableaux GPU. Le spaCy peut être installé sur un GPU en spécifiant spacy[cuda], spacy[cuda90], spacy[cuda91], spacy[cuda92], spacy[cuda100], spacy[cuda101], spacy[cuda102], spacy[cuda110] ou spacy[cuda111]. Si vous connaissez votre version de CUDA, l'utilisation du spécificateur plus explicite permet d'installer cupy via wheel, ce qui permet de gagner du temps de compilation. Les prescripteurs devraient installer cupy.

pip install -U spacy
pip install -U spacy[cuda92]

Une fois que vous avez une installation compatible GPU, la meilleure façon de l'activer est d'appeler spacy.prefer_gpu ou spacy.require_gpu() quelque part dans votre script avant que les modèles ne soient chargés. Le require_gpu générera une erreur si aucun GPU n'est disponible.

import spacy

spacy.prefer_gpu()
nlp = spacy.load("en_core_web_sm")

Compiler à partir de la source

L'autre façon d'installer spaCy est de cloner son dépôt GitHub et de le construire à partir des sources. C'est la méthode courante si vous souhaitez apporter des modifications à la base de code. Vous devrez vous assurer que vous disposez d'un environnement de développement composé d'une distribution Python comprenant des fichiers d'entête, un compilateur, pip, virtualenv et git installés. La partie compilateur est la plus délicate, puisqu'elle dépend de votre système.

git clone https://github.com/explosion/spaCy
cd spaCy
python -m venv .env
source .env/bin/activate
python -m pip install -U pip setuptools wheel
pip install .


Dernière mise à jour : Vendredi, le 6 mars 2020