Cette étude vise à examiner la relation entre les compétences lexicales/phraséologiques et la qualité de la production écrite des étudiants de l’anglais/langue étrangère. Un échantillon de 120 essais explicatifs écrits par des étudiants des semestres 1 et 5 dans un contexte EFL moins compétent, sont notés par des évaluateurs humains et examinés pour les indices cibles en utilisant un traitement automatique. Les résultats montrent que, contrairement à l'indice de diversité lexicale, la fréquence et la distribution contextuelle de mots de contenu peuvent distinguer entre les deux différents niveaux. Pour les indices phraséologiques, les proportions de bigrammes rares et fréquents ont produit des différences entre les deux groupes : les étudiants de S5 sont les plus performants avec de meilleurs résultats dans les deux catégories. À l'aide d'une régression linéaire, les résultats montrent que l'utilisation de mots de contenu rares et contextuellement restreints et aussi une plus grande proportion de bigrammes rares et fréquents pourraient être considérés comme des indicateurs d'une meilleure compétence en production écrite. L'étude suggère des implications pour l'enseignement et l’apprentissage de l'anglais en tant que langue étrangère.