Data Modeller (zdalnie)

Be in IT to firma rekrutacyjna, wyspecjalizowana w poszukiwaniu Specjalistów z branży technologii informatycznych. Obecnie, dla naszego klienta, poszukujemy osoby na stanowisko: Data Modeller. 

Zakres obowiązków:

  • Długofalowa współpraca z międzynarodową, topową firmą consultingową realizującą projekty IT dla dużych i średnich organizacji z sektorów tj. automotive, finanse, bankowość oraz produkcja.
  • Poszukujemy 3 Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.
  • Osoby na tym stanowisku będą wspierać projekt Causal Biology Tech Build, którego celem jest: rozwój i integracja wiedzy na temat przyczynowych oraz mechanistycznych podstaw chorób, zwiększenie liczby wniosków dotyczących zależności przyczynowych pomiędzy genami a chorobami, udostępnienie naukowcom R&D zintegrowanych produktów danych zgodnych z zasadami FAIR, umożliwiających szybkie wyszukiwanie informacji i podejmowanie decyzji.

Oczekujemy:

  • Poszukujemy 3 Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.
  • Bardzo dobre doświadczenie w konceptualnym, logicznym i kanonicznym modelowaniu danych dla złożonych domen biomedycznych lub naukowych.
  • Umiejętność modelowania encji biomedycznych, takich jak: geny, targety terapeutyczne, choroby, wskazania medyczne, fenotypy, mechanizmy biologiczne, biomarkery, tkanki, typy komórek, modalności testów i badań, dowody naukowe, pochodzenie danych, zależności przyczynowe.
  • Duże doświadczenie w harmonizacji danych, w tym: mapowanie danych źródłowych do modelu kanonicznego, dopasowywanie kontrolowanych słowników, stosowanie trwałych identyfikatorów, modelowanie lineage i provenance danych. Praktyczne doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, obejmujące: klasy, sloty i atrybuty, zakresy wartości, identyfikatory, pola wymagane, ograniczenia, kardynalność, opisy, powiązania z ontologiami.
  • Bardzo dobra znajomość zasad FAIR Data, w tym: findability, accessibility, interoperability, reusability, persistent identifiers, standardy metadanych, provenance, wersjonowanie schematów.
  • Doświadczenie w pracy z ontologiami biomedycznymi i kontrolowanymi słownikami, takimi jak: HGNC, Ensembl, UniProt, MONDO, Disease Ontology, HPO, EFO, UBERON, Cell Ontology, Gene Ontology, Reactome, KEGG, ChEBI, OBI, LOINC, UCUM, ECO, SEPIO, Relation Ontology, PATO.
  • Umiejętność definiowania reguł walidacyjnych i kontroli jakości danych, w tym: walidacja terminów ontologicznych, sprawdzanie zakresów wartości, kontrola wymaganych pól, weryfikacja spójności identyfikatorów i etykiet, kontrola spójności pomiędzy polami, weryfikacja kompletności informacji o pochodzeniu danych.
  • Umiejętność projektowania modeli danych wspierających: pipeline’y danych, API, grafy wiedzy, produkty danych FAIR, procesy analityczne, zapytania i potrzeby użytkowników z obszaru R&D.
  • Doświadczenie w zarządzaniu cyklem życia schematów danych, w tym: repozytoria schematów oparte na GitHubie, semantic versioning, changelogi, wersjonowane releasy, słowniki danych, katalogi metadanych, analiza wpływu zmian na systemy downstream. 
  • Umiejętność współpracy z zespołami i interesariuszami, takimi jak: Scientific Knowledge Engineering, eksperci domenowi Causal Biology, Data Engineering, Knowledge Graph Engineering, Product Management, Data Stewards, zespoły platformowe.
  • Mile widziane: doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, tworzenie schematów w formacie YAML; Narzędzia do obsługi ontologii biomedycznych i kontrolowanych słowników; Technologie modelowania semantycznego: RDF, OWL, JSON-LD, SHACL, ShEx, SPARQL; Modelowanie grafów wiedzy; Narzędzia typu schema registry lub model registry. Katalogi danych i rejestry metadanych; Zarządzanie słownikami danych; Modelowanie lineage i provenance danych; Narzędzia do walidacji schematów i kontroli jakości danych; Podejścia do mapowania danych źródłowych do modelu kanonicznego. Ocena metadanych zgodnie z zasadami FAIR.
  • Znajomość języka angielskiego na poziomie B2 lub C1 – umożliwiająca swobodną komunikację w międzynarodowym środowisku.
  • Mile widziana dostępność ASAP; akceptowalny jest maksymalnie miesięczny okres wypowiedzenia.

Oferujemy:

  • Długofalowa współpraca z wynagrodzeniem w przedziale 100 -130 PLN netto/godz. + VAT.
  • Wsparcie przy zakładaniu i prowadzeniu działalności gospodarczej, dla osób bez takiego doświadczenia. 
  • Sprawny proces rekrutacyjny - dwie rozmowy techniczne z managerami, online (każda maksymalnie po godzinie). 
  • Współpraca w pełni zdalna, możliwa także w godzinach EST/UK. 
  • Benefity - prywatna opieka medyczna, karta Multisport. 
  • Nowoczesny sprzęt zapewniany przez firmę, wraz z softem i konfiguracją.

100 – 130 PLN

salary_range.period.net.hourly - salary_range.contract_type.b2b

job_post.job_details

job_post.job_type

job_type.contract

job_post.job_location

Warszawa

job_post.remote_status

remote_status.remote
ID: 877 job_post.published_on: 05/06/2026
announcement.apply