
Opdrachten
Info
Functie
Tekst analist / Data ScientistLocatie
Den HaagUren per week
5 uren per weekLooptijd
31.12.2023 - 29.06.2024Opdrachtnummer
150924Sluitingsdatum
De auditdienst van het Centraal Orgaan opvang asielzoekers zoekt ondersteuning bij het uitvoeren van tekstanalyse.
Het gaat hierbij om ondersteuning, kennisoverdracht en samen de tekstanalyse uitvoeren. De auditor heeft basiskennis van tekstanalyse met Python m.b.v. transformers, maar kan de tekstanalyse nog niet zelfstandig uitvoeren. Hij gebruikt Jupyter.
Het gaat om anonimisering o.b.v. name entity recognition, eenvoudige sentimentanalyse en/of one shot learning, topic analyse en categorisering. Het betreft ongelabelde tekst data. Het gegevensbestand bevat persoonsgevoelige data, daarom dient het bestand eerst te worden geanonimiseerd en daarom dient de data scientist een geheimhoudingsverklaring te tekenen die onderdeel uitmaakt van de overeenkomst van opdracht. De datascientist werkt direct samen met de auditor.
Technische uitdaging is dat er gewerkt moet worden met een virtual environment in een omgeving zonder internet verbinding (beheeromgeving). Het is belangrijk dat de data scientist daar ervaring mee heeft. De virtual environment moet opgezet worden in een omgeving die in contact is met het internet, maar draait om veiligheidsredenen op een omgeving van het COA zonder toegang tot het internet.
De werkzaamheden vinden plaats bij voorkeur in Den Haag, waarbij Rotterdam ook een optie is. De auditor kan de datascientist ook bezoeken.
De inschatting is dat er twee keer per maand 4 tot 5 uur begeleiding is door de datascientist van de auditor gedurende een periode van 6 maanden. In totaal maximaal 60 uur.
Centraal Orgaan opvang asielzoekers - Non-ICT (COA)
De auditdienst van het Centraal Orgaan opvang asielzoekers zoekt ondersteuning bij het uitvoeren van tekstanalyse.
Het gaat hierbij om ondersteuning, kennisoverdracht en samen de tekstanalyse uitvoeren. De auditor heeft basiskennis van tekstanalyse met Python m.b.v. transformers, maar kan de tekstanalyse nog niet zelfstandig uitvoeren. Hij gebruikt Jupyter.
Het gaat om anonimisering o.b.v. name entity recognition, eenvoudige sentimentanalyse en/of one shot learning, topic analyse en categorisering. Het betreft ongelabelde tekst data. Het gegevensbestand bevat persoonsgevoelige data, daarom dient het bestand eerst te worden geanonimiseerd en daarom dient de data scientist een geheimhoudingsverklaring te tekenen die onderdeel uitmaakt van de overeenkomst van opdracht. De datascientist werkt direct samen met de auditor.
Technische uitdaging is dat er gewerkt moet worden met een virtual environment in een omgeving zonder internet verbinding (beheeromgeving). Het is belangrijk dat de data scientist daar ervaring mee heeft. De virtual environment moet opgezet worden in een omgeving die in contact is met het internet, maar draait om veiligheidsredenen op een omgeving van het COA zonder toegang tot het internet.
De werkzaamheden vinden plaats bij voorkeur in Den Haag, waarbij Rotterdam ook een optie is. De auditor kan de datascientist ook bezoeken.
De inschatting is dat er twee keer per maand 4 tot 5 uur begeleiding is door de datascientist van de auditor gedurende een periode van 6 maanden. In totaal maximaal 60 uur.
HeadFirst
Voor deze opdracht dien je een bieding te plaatsen op Striive. Striive is het grootste opdrachtenplatform van de Benelux waar jaarlijks meer dan 20.000 opdrachten gepubliceerd worden.