Be in IT to firma rekrutacyjna, wyspecjalizowana w poszukiwaniu Specjalistów z branży technologii informatycznych. Obecnie, dla naszego klienta, poszukujemy osoby na stanowisko: Data Modeller.
Data Modeller (zdalnie)
Zakres obowiązków:
- Długofalowa współpraca z międzynarodową, topową firmą consultingową realizującą projekty IT dla dużych i średnich organizacji z sektorów tj. automotive, finanse, bankowość oraz produkcja.
- Poszukujemy 3 Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.
- Osoby na tym stanowisku będą wspierać projekt Causal Biology Tech Build, którego celem jest: rozwój i integracja wiedzy na temat przyczynowych oraz mechanistycznych podstaw chorób, zwiększenie liczby wniosków dotyczących zależności przyczynowych pomiędzy genami a chorobami, udostępnienie naukowcom R&D zintegrowanych produktów danych zgodnych z zasadami FAIR, umożliwiających szybkie wyszukiwanie informacji i podejmowanie decyzji.
Oczekujemy:
- Poszukujemy 3 Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.
- Bardzo dobre doświadczenie w konceptualnym, logicznym i kanonicznym modelowaniu danych dla złożonych domen biomedycznych lub naukowych.
- Umiejętność modelowania encji biomedycznych, takich jak: geny, targety terapeutyczne, choroby, wskazania medyczne, fenotypy, mechanizmy biologiczne, biomarkery, tkanki, typy komórek, modalności testów i badań, dowody naukowe, pochodzenie danych, zależności przyczynowe.
- Duże doświadczenie w harmonizacji danych, w tym: mapowanie danych źródłowych do modelu kanonicznego, dopasowywanie kontrolowanych słowników, stosowanie trwałych identyfikatorów, modelowanie lineage i provenance danych. Praktyczne doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, obejmujące: klasy, sloty i atrybuty, zakresy wartości, identyfikatory, pola wymagane, ograniczenia, kardynalność, opisy, powiązania z ontologiami.
- Bardzo dobra znajomość zasad FAIR Data, w tym: findability, accessibility, interoperability, reusability, persistent identifiers, standardy metadanych, provenance, wersjonowanie schematów.
- Doświadczenie w pracy z ontologiami biomedycznymi i kontrolowanymi słownikami, takimi jak: HGNC, Ensembl, UniProt, MONDO, Disease Ontology, HPO, EFO, UBERON, Cell Ontology, Gene Ontology, Reactome, KEGG, ChEBI, OBI, LOINC, UCUM, ECO, SEPIO, Relation Ontology, PATO.
- Umiejętność definiowania reguł walidacyjnych i kontroli jakości danych, w tym: walidacja terminów ontologicznych, sprawdzanie zakresów wartości, kontrola wymaganych pól, weryfikacja spójności identyfikatorów i etykiet, kontrola spójności pomiędzy polami, weryfikacja kompletności informacji o pochodzeniu danych.
- Umiejętność projektowania modeli danych wspierających: pipeline’y danych, API, grafy wiedzy, produkty danych FAIR, procesy analityczne, zapytania i potrzeby użytkowników z obszaru R&D.
- Doświadczenie w zarządzaniu cyklem życia schematów danych, w tym: repozytoria schematów oparte na GitHubie, semantic versioning, changelogi, wersjonowane releasy, słowniki danych, katalogi metadanych, analiza wpływu zmian na systemy downstream.
- Umiejętność współpracy z zespołami i interesariuszami, takimi jak: Scientific Knowledge Engineering, eksperci domenowi Causal Biology, Data Engineering, Knowledge Graph Engineering, Product Management, Data Stewards, zespoły platformowe.
- Mile widziane: doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, tworzenie schematów w formacie YAML; Narzędzia do obsługi ontologii biomedycznych i kontrolowanych słowników; Technologie modelowania semantycznego: RDF, OWL, JSON-LD, SHACL, ShEx, SPARQL; Modelowanie grafów wiedzy; Narzędzia typu schema registry lub model registry. Katalogi danych i rejestry metadanych; Zarządzanie słownikami danych; Modelowanie lineage i provenance danych; Narzędzia do walidacji schematów i kontroli jakości danych; Podejścia do mapowania danych źródłowych do modelu kanonicznego. Ocena metadanych zgodnie z zasadami FAIR.
- Znajomość języka angielskiego na poziomie B2 lub C1 – umożliwiająca swobodną komunikację w międzynarodowym środowisku.
- Mile widziana dostępność ASAP; akceptowalny jest maksymalnie miesięczny okres wypowiedzenia.
Oferujemy:
- Długofalowa współpraca z wynagrodzeniem w przedziale 100 -130 PLN netto/godz. + VAT.
- Wsparcie przy zakładaniu i prowadzeniu działalności gospodarczej, dla osób bez takiego doświadczenia.
- Sprawny proces rekrutacyjny - dwie rozmowy techniczne z managerami, online (każda maksymalnie po godzinie).
- Współpraca w pełni zdalna, możliwa także w godzinach EST/UK.
- Benefity - prywatna opieka medyczna, karta Multisport.
- Nowoczesny sprzęt zapewniany przez firmę, wraz z softem i konfiguracją.