Data Modeller (zdalnie)

Be in IT to firma rekrutacyjna, wyspecjalizowana w poszukiwaniu Specjalistów z branży technologii informatycznych. Obecnie, dla naszego klienta, poszukujemy osoby na stanowisko: Data Modeller.

Zakres obowiązków:

Długofalowa współpraca z międzynarodową, topową firmą consultingową realizującą projekty IT dla dużych i średnich organizacji z sektorów tj. automotive, finanse, bankowość oraz produkcja.
Poszukujemy 3 Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.
Osoby na tym stanowisku będą wspierać projekt Causal Biology Tech Build, którego celem jest: rozwój i integracja wiedzy na temat przyczynowych oraz mechanistycznych podstaw chorób, zwiększenie liczby wniosków dotyczących zależności przyczynowych pomiędzy genami a chorobami, udostępnienie naukowcom R&D zintegrowanych produktów danych zgodnych z zasadami FAIR, umożliwiających szybkie wyszukiwanie informacji i podejmowanie decyzji.

Oczekujemy:

Poszukujemy 3 Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.
Bardzo dobre doświadczenie w konceptualnym, logicznym i kanonicznym modelowaniu danych dla złożonych domen biomedycznych lub naukowych.
Umiejętność modelowania encji biomedycznych, takich jak: geny, targety terapeutyczne, choroby, wskazania medyczne, fenotypy, mechanizmy biologiczne, biomarkery, tkanki, typy komórek, modalności testów i badań, dowody naukowe, pochodzenie danych, zależności przyczynowe.
Duże doświadczenie w harmonizacji danych, w tym: mapowanie danych źródłowych do modelu kanonicznego, dopasowywanie kontrolowanych słowników, stosowanie trwałych identyfikatorów, modelowanie lineage i provenance danych. Praktyczne doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, obejmujące: klasy, sloty i atrybuty, zakresy wartości, identyfikatory, pola wymagane, ograniczenia, kardynalność, opisy, powiązania z ontologiami.
Bardzo dobra znajomość zasad FAIR Data, w tym: findability, accessibility, interoperability, reusability, persistent identifiers, standardy metadanych, provenance, wersjonowanie schematów.
Doświadczenie w pracy z ontologiami biomedycznymi i kontrolowanymi słownikami, takimi jak: HGNC, Ensembl, UniProt, MONDO, Disease Ontology, HPO, EFO, UBERON, Cell Ontology, Gene Ontology, Reactome, KEGG, ChEBI, OBI, LOINC, UCUM, ECO, SEPIO, Relation Ontology, PATO.
Umiejętność definiowania reguł walidacyjnych i kontroli jakości danych, w tym: walidacja terminów ontologicznych, sprawdzanie zakresów wartości, kontrola wymaganych pól, weryfikacja spójności identyfikatorów i etykiet, kontrola spójności pomiędzy polami, weryfikacja kompletności informacji o pochodzeniu danych.
Umiejętność projektowania modeli danych wspierających: pipeline’y danych, API, grafy wiedzy, produkty danych FAIR, procesy analityczne, zapytania i potrzeby użytkowników z obszaru R&D.
Doświadczenie w zarządzaniu cyklem życia schematów danych, w tym: repozytoria schematów oparte na GitHubie, semantic versioning, changelogi, wersjonowane releasy, słowniki danych, katalogi metadanych, analiza wpływu zmian na systemy downstream.
Umiejętność współpracy z zespołami i interesariuszami, takimi jak: Scientific Knowledge Engineering, eksperci domenowi Causal Biology, Data Engineering, Knowledge Graph Engineering, Product Management, Data Stewards, zespoły platformowe.
Mile widziane: doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, tworzenie schematów w formacie YAML; Narzędzia do obsługi ontologii biomedycznych i kontrolowanych słowników; Technologie modelowania semantycznego: RDF, OWL, JSON-LD, SHACL, ShEx, SPARQL; Modelowanie grafów wiedzy; Narzędzia typu schema registry lub model registry. Katalogi danych i rejestry metadanych; Zarządzanie słownikami danych; Modelowanie lineage i provenance danych; Narzędzia do walidacji schematów i kontroli jakości danych; Podejścia do mapowania danych źródłowych do modelu kanonicznego. Ocena metadanych zgodnie z zasadami FAIR.
Znajomość języka angielskiego na poziomie B2 lub C1 – umożliwiająca swobodną komunikację w międzynarodowym środowisku.
Mile widziana dostępność ASAP; akceptowalny jest maksymalnie miesięczny okres wypowiedzenia.

Oferujemy:

Długofalowa współpraca z wynagrodzeniem w przedziale 100 -130 PLN netto/godz. + VAT.
Wsparcie przy zakładaniu i prowadzeniu działalności gospodarczej, dla osób bez takiego doświadczenia.
Sprawny proces rekrutacyjny - dwie rozmowy techniczne z managerami, online (każda maksymalnie po godzinie).
Współpraca w pełni zdalna, możliwa także w godzinach EST/UK.
Benefity - prywatna opieka medyczna, karta Multisport.
Nowoczesny sprzęt zapewniany przez firmę, wraz z softem i konfiguracją.

Zakres obowiązków:

Oczekujemy:

Oferujemy:

job_post.job_type

job_post.job_location

job_post.remote_status

job_post.job_details

job_post.job_type

job_post.job_location

job_post.remote_status