Gedaan met laden. U bevindt zich op: Tijdigere en nieuwe bedrijfsindicatoren op basis van web scraping Projecten en onderzoek

Tijdigere en nieuwe bedrijfsindicatoren op basis van web scraping

In dit project worden bedrijfsindicatoren ontwikkeld op basis van natural language processing op teksten van Belgische bedrijfswebsites.

Dit project loopt nog. Eens dit project afgerond is, kunt u op deze pagina een volledige beschrijving vinden.

Doelstelling

In dit project worden enkele eerste bedrijfsindicatoren ontwikkeld op basis van natural language processing toegepast op de teksten gescrapet van websites van Belgische ondernemingen.
Bedrijfsstatistieken kunnen op deze manier op zeer frequente basis geproduceerd worden op basis van de gehele set bedrijven met gekende website.

Gebruikte data

Dit project maakt gebruik van een dataset van alle Belgische ondernemingen met een rechtspersoonlijkheid waarvoor een URL gekend is.

Methodes

In dit project wordt gebruik gemaakt van web scraping voor het downloaden van zichtbare teksten van bedrijfswebsites.

In dit project wordt gebruik gemaakt van Natural Language Processing en Machine Learning om de zichtbare text automatisch te categoriseren.

Resultaat

Dit project loopt nog, en er zijn nog geen deelbare resultaten beschikbaar. Eens beschikbaar zullen deze op deze pagina verschijnen.