Project: Algolit

Des mots aux numéros en utilisant tf-idf

Algolit, groupe de travail sur la littérature et le code libre, organise une journée autour de ’term frequency–inverse document frequency (tf-idf), une méthode de pondération souvent utilisée en recherche d’information et en particulier dans la fouille de textes. Cette mesure statistique permet d’évaluer l’importance d’un terme contenu dans un document, relativement à une collection ou un corpus.
Ou encore une technique utilisée dans l’apprentissage automatique qui permet à la machine de convertir le texte en numéros et de faire des calculs.

Des connaissances préalables ne sont pas requises, mais si vous savez programmer vous êtes évidemment les bienvenus. Les recettes permettent d’entrer à différents niveaux dans la pratique de l’écriture algorithmique. Elles peuvent être performées de manière physique, numérique ou métaphorique. Les résultats des exercices seront documentés à la fin de la journée.


@ Constant wtc25

Tower 1, 25th floor, Kon Albert I laan 30 Av Roi Albert I, 1000 Brussels