Ce projet a pour but d’extraire des informations de plusieurs documents PDF. Ici nous avons utilisé 12 fichiers PDF contenant des examens d’entrainement au test de l’AMF, avec 120 questions par fichier. Une fois l’extraction – de ces questions et des réponses – réalisée, la mise en forme de ces informations sous forme de DataFrame va nous permettre d’utiliser ces données dans un cadre de perfectionnement. En passant par différente étape intermédiaire (extraction des données, mise en forme des données dans un tableau, filtrage des données par mots clés, filtrage des questions réussies), nous sommes en mesure de nous entrainer sur les questions de l’AMF autant de fois que nécessaire grâce à une fonction posant des questions aléatoirement.