Data Scientist

Fiecare companie care activeaza in zona de business, fie ca ne referim la IT sau alt domeniu, dispune de seturi mari si chiar foarte mari de date din foarte multe zone (financiare, tehnice etc.). Un job corespunzator acestei zone de analiza este cel de data scientist, intalnit ca denumire si sub numele de data analyst sau data specialist.

Jobul de data scientist presupune prin excelenta analiza diferitelor tipuri si cantitati de date care pot proveni din diverse surse, cu scopul de a identifica anumite relatii intre acestea (corelatii, cauzalitati etc.), astfel incat sa determine tipare sau concluzii despre mersul business-ului si al dezvoltarii tehnice in general.

Acest specialist trebuie sa aiba o minte analitica extrem de dezvoltata, sa judece in mod corelativ diversele tipuri de date care pot fi dintre cele mai diverse, si sa incerce sa vada in sirurile de numere ceea ce o simpla persoana nu ar putea sa observe.

Acest job de data scientist este unul din relativ putinele posturi din industria IT care necesita cunostinte si chiar studii destul de solide de matematica. Acest lucru nu se datoreaza doar faptului ca lucreaza permanent cu cifre, ci si pentru ca trebuie sa stie cum sa le interpreteze.

Din aceasta cauza, pozitia necesita cunostinte solide de statistica, teoria numerelor mari, teoria probabilitatilor si multe altele. Pe langa notiuni de matematica, analiza datelor se poate face si cu instrumente informatice, precum limbajul Python sau R si anumite librarii dedicate, precum Pandas.

Tooluri si tehnologii folosite

  • Apache Hadoop
  • Apache Spark
  • BigML
  • D3
  • Google BigQuery