At work, I recently wanted to visualize how we annotated documents that we store as JSON in Elasticsearch. We annotate substrings with different codes, and I wanted to show those codes using colors in a terminal. This basically boils down to outputting JSON with ANSI escape codes. The easier part …
read moreHow do you limit memory usage with asyncio?
One of the first hurdles that you can encounter when trying out asyncio is "asyncio eats all my memory!". Indeed, to keep your CPU busy, you're encouraged to launch a lot of coroutines simultaneously. Coroutines don't use a lot of memory by themselves, but what you're doing inside them can …
read moreWhat Color is Your Python async Library?
Since I've began to program, I've heard everywhere that synchronous, sequential programming is a way of the past. In a manycore future, we will need to write programs that execute in parallel. But aside from embarassingly parallel programs, this has always been considered to be too difficult to be worth …
read moreDiagnostiquer un problème de connexion Internet à La Réunion
Je travaille à distance depuis La Réunion. La première condition pour du télétravail réussi, c'est d'avoir une bonne connexion Internet. C'est parfaitement possible à La Réunion, mais comment faire quand ça ne va pas ? Il faut savoir où est un problème pour pouvoir le corriger. En arrivant ici, j'aurais aimé …
read moreLes frames sémantiques aident à évaluer la traduction automatique
Ce papier traite de l'évaluation de la traduction automatique et propose une nouvelle solution : HMEANT. Traditionnellement, l'évaluation est faite par rapport à une ou plusieurs références humaines en utilisant le score BLEU …
read moreS'inspirer de l'apprentissage sémantique humain pour nos pauvres algorithmes
Je viens d'écouter une présentation passionante de Josh Tenenbaum intitulée « Towards More Human-like Machine Learning of Word ». L'idée est de s'inspirer de l'apprentissage du vocabulaire par les enfants pour mieux apprendre la sémantique des mots en Traitement Automatique des Langues.
Points intéressants ici :
- On utilise le vocabulaire du machine learning …
Utilité du zeugma
Outre ses qualités rhétoriques, le zeugma peut servir aussi de test linguistique afin de déterminer si deux sens possibles d'un mot sont distincts. C'est très utile pour les lexicographes qui constituent un dictionnaire : faut-il inclure ce sens ? (En pratique, c'est plus complexe, il existe bien d'autres tests ; qui ont tous …
read moreHumour en « traduction automatique »
Un transfuge n'est pas un simple déserteur : il a quitté son pays pour rejoindre le pays ennemi. Kim Philby semble être le transfuge le plus connu : officiellement espion du MI6, il était en réalité agent double à la solde du KGB, et s'est exilé en Russie pour éviter son procès …
read moreLa complexité amortie pour l'apprenti programmeur
Cet article a pour but d'expliquer un concept de manière simple : le but est que vous ayez une nouvelle flèche dans votre carquois à la fin de cet article. C'est pas extrêmement rigoureux, mais l'important est de retenir le principe, qui est utile au jour le jour. Ceci dit, je …
read moreFair votes now!
Mise à jour : une entente semble avoir été trouvée, ce sera bien un hung parliament avec Cameron et Clegg.
Si vous vous êtes intéressés de loin à l'actualité internationale de ce début de mois de mai 2010, vous avez peut-être entendu parler des élections tenues au Royaume-Uni et des nombreux …
read more