32 collectifs

Breakfast in America

A propos

Sales led Growth for B2B SaaS -> We help you sign US Customers.

Byteworks

A propos

Build, ship, repeat

FA#

A propos

Automatisation & Optimisation: Votre duo d'experts pour des process métier performants et une croissance accélérée.

PassePartout Services

A propos

L'offre de conseil et réalisation de PassePartout - les créateurs du micropaiement éponyme - à votre service pour vos produits #médias #paiement #IA #data

LICTER

A propos

Comprenez ce qui séduit vos cibles & vos clients. Collectif Market research, social listening & consumer insights

Glance data

A propos

Leverage your data to make smarter business decisions through AI

Fyce Tech

A propos

Digitalisez votre vision en No-code

ISquare

A propos

Nous façonnons les projets de nos clients en fusionnant le meilleur des deux mondes du NoCode et du Code.

adalab

A propos

L'expertise data au service de projet à impact positif

Fada Collectif

A propos

Du talent à l'état pur, de la folie bien dosée

Tyrscale

A propos

Be data driven

Hyperstack

A propos

Data team as a Service

Sypher

A propos

Turn your data into actions to activate x2 qualified leads

LumosAI

A propos

Tailor-made Machine Learning.

The data strategy logo

The data strategy

Services IT & ConsultingMédiasTPE


Scrapping et Classification de post Doctissimo

L'objectif de cette mission était de scrapper les posts de plusieurs forums pour faire de l'analyse de tendance sur les réseaux sociaux et les classifier dans 20 catégories


J'ai mené une mission de scrapping de postes pour The Data Strategy, dans un objectif d'analyse de tendance sur les réseaux sociaux. La mission s'est déroulée sur une durée de 6 mois, en autonomie, et comprenait trois étapes principales:

1. Scrapping de postes:

J'ai développé plusieurs scrappers pour extraire les postes de différents forums tels que Mompreneurs et Doctissimo. Ces scrappers ciblaient à la fois des sites statiques et dynamiques. L'un des plus importants d'entre eux, déployé sur Doctissimo, a pu récupérer jusqu'à 5 millions de posts par semaine.

2. Interface de labellisation:

J'ai conçu une interface pour labelliser les données d'entraînement à des fins d'apprentissage automatique. Ceci a permis de classer les postes en 20 catégories de sujets de conversation.

3. Utilisation d'algorithmes d'intelligence artificiell:

Grâce aux données d'entraînement labellisées, j'ai entraîné des algorithmes d'intelligence artificielle afin de catégoriser automatiquement les postes récupérés. Les résultats de ces classifications ont ensuite été stockés dans une base de données et utilisés pour alimentation un outil d'analyse manuelle de tendance sur les réseaux sociaux.

Au terme des 6 mois, j'ai réussi à élaborer un outil en production capable d'analyser et catégoriser les postes sur une base hebdomadaire pour de meilleurs résultats.

Membres

Expertises

ScrappingJavascript & TypescriptPython

De

Sept. 2017 à Mars 2017