Senior Data Analyst

gewünschte Einsatzorte:
deutschlandweit
bevorzugt in Berlin
Wohnort:
Falkensee
Rollen:
Ich gehe gerne voran und erschließe in enger Abstimmung mit meinen Kunden Neuland.


Analyst, Entwickler / Programmierer

Skills:
Datenbanken
Datenbanken sind meine Kernkompetenz. In den letzten Jahren standen Analysen und Visualisierungen im Vordergrund.
Google BigQuery, Spark.sql, MS SQL Server, MS-SQL-Server Integration Services 2017, Oracle 12c
Datenanalyse
90 Prozent meiner Datenanalysen erfolgen gegenwärtig in BigQuery, Tableau, GSheets und Python. 
MS Excel / Google Sheets, Tableau, Python, Statistische Verfahren, Power BI, Google Looker
Programmiersprachen
SQL, VBA
Fremdsprachen
Englisch
Ways of Working
GitHub, Scrum, Kanban, Jira, Miro, Slack

Ausbildung:
Diplom Volkswirt (Freie Universität Berlin)

Start - Ende
Name
Institut
Beschreibung
02/2021
Künstliche Intelligenz mit Deep Learning
Heise Akademie
11/2020
Security Awareness
ERT Talent Development
09/2017 - 11/2017
Scrum Training
ERT Talent Development
07/2009 - 02/2010
Business Englisch Berlitz Level 6
Berlitz
Projekte:
08/2021 - 02/2023
Smart Advertising Analyst
Analytische Unterstützung und Qualitätskontrolle bei der Durchführung und Automatisierung von A/B Tests. Laufende und adhoc Analysen, Prognosen und Auswertungen, Betreuung und Entwicklung von Reports und Dashboards, Entwicklung und Verbesserung von Metriken, KPIs und OKRs. Unterstützung des Teams bei der Umsetzung und Verbesserung von agilen Arbeitsmethoden (Scrum, Kanban).

Branche: e-Commerce
Rolle(n): Analyst
Skills: Spark.sql, Tableau, Python, Google BigQuery, Google Sheets, Statistische Verfahren, Agile Entwicklung
10/2020 - 07/2021
Reporting: Patienten-Fragebögen
Kundenspezifische Anpassungen von Standardreports.
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: TSQL, PL-SQL, Logi Studio 12
07/2020 - 09/2020
Analyse und Visualisierung von Antwortzeiten eines Online-Services
Für die Begutachtung klinischer Messdaten waren maximale Antwortzeiten mit den Gutachtern vereinbart. Meine Aufgabe bestand darin, die tatsächlichen Antwortzeiten grafisch und tabellarisch im PowerBI-Portal aufzubereiten, statistisch auszuwerten und Zeitüberschreitungen qualifiziert zu kennzeichnen.
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: MS SQL-Server 2019, MS SQL-Server Integration Service, PowerBI (Desktop/Server)
04/2020 - 07/2020
Visualisierung von Daten-Durchlaufzeiten
Bei der Prozessierung von Daten durch verschiedene Systeme kam es wiederholt zu erheblichen Überschreitungen der vereinbarten Durchlaufzeit. Meine Aufgabe bestand darin, den Datenfluss zu visualisieren, um Engpässe (rückwirkend) identifizieren zu können:
  • Identifikation der betroffenen Systeme und möglicher Messpunkte,
  • Protokollieren der Durchlaufzeiten zwischen den Messpunkten,
  • Bestimmung der Zeitzonen von Quell- und Zielsystemen und Überführung nach UTC,
  • Ermittlung/Verhandlung von Alarm-Schwellwerten,
  • grafische und tabellarische Aufbereitung in einem Reporting-Portal (PowerBI Server)
Das Projekt wird im Herbst 2020 mit einem Livedaten-Monitoring fortgesetzt.
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: MS SQL-Server 2019, MS SQL-Server Integration Service, MS PowerBI (Desktop/Server)
12/2019 - 04/2020
Sensordaten Monitoring
Nachdem bei einigen medizinischen Messgeräten, von denen weltweit 25.000 Stück im Einsatz sind, unter bestimmten Einsatzbedingungen ein Sensorfehler bei Messreihen festgestellt wurde, mußten schnellstmöglich alle betroffenen Geräte anhand der täglichen Messdatenübertragungen identifiziert und ausgetauscht werden. Meine Aufgaben waren:  
  • Identifizierung und Klassifizierung möglicher fehlerhafter Sensordaten anhand eines Python Machine-Learning Moduls,
  • Grafische Bereitstellung der Messreihen mit statistischen Kenngrößen zur Messreihenqualität (Quartile, Median, Standardabweichung, Outlier-Kennzeichnung) in einem interaktiven Berichtsportal (PowerBI Server)
  • Frontend zur Erfassung eines Prüfprotokolls (MS Access) und folglich Filterung der Daten im PowerBI (geprüfte Geräte erscheinen nur unter konfigurierbaren Bedingungen im PowerBI Outlier-Report
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: MS SQL-Server 2017, MS SQL Server Integration Service, MS Excel 2013, MS PowerBI, MS Access 2013, Python SKLearn, Statistik
07/2019 - 12/2019
Prototypentwicklung: Geräte- und Adressmapping
Tool zur Planung von Partitionsbelegungen auf Laptops mit Laufzeitumgebungen verschiedener klinischer Studien. Die Partitionen wurden bisher studienbezogen vom Hersteller erfasst, wobei sich mehrere gleichartige Laptops am gleichen Ort (Krankenhaus, Arztpraxis) befinden konnten. Da ein automatisiertes Mapping nicht möglich war (die Adress- und Kontakterfassung wichen von Studie zu Studie und Land zu Land zu stark voneinander ab), musste eine hybride Lösung (manuelles Mapping + Teilautomatisierung) entwickelt werden.
Der Prototyp wird zunächst für die Partitionsverwaltung von ca. 800 Laptops eingesetzt. Im nächsten Schritt ist die Umsetzung auf ein Webportal geplant.       



Branche: Pharma
Rolle(n): Berater / Consulter
Skills: MS SQL-Server 2017, MS-SQL-Server Integration Services 2017, MS Excel 2013, MS Access 2013
02/2019 - 04/2019
ClinicalTrials.gov
Visualisierung von Highlevel-Daten der ClinicalTrials.gov Datenbank mit z.Zt. Daten aus 350.000 klinischen Studien:
  • Welche Krankheiten stehen im Mittelpunkt?
  • Welche Firmen/Institutionen sind besonders aktiv in welchen Feldern?
  • Mapping der kommerziellen Sponsoren (Pharma-Firmen)
  • Stichwort-Mapping bei Atemwegserkrankungen
  • Kennzahlen der wichtigsten Pharmafirmen (aus Finanzportalen)
 
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: PostgreSQL, MS Power BI, MS Access 2013
10/2018 - 02/2019
Machine Learning: Overread-Automatisierung
"Proof of Concept" Projekt. Gezeigt werden sollte, dass die Qualitätsbeurteilung von Lungenfunktionsmessreihen (Spirometrie) weitgehend automatisiert werden kann. Diese Qualitätsbeurteilung (Overreads) wurden bisher von einem kostenintensiven weltweiten Netz von Lungenfachärzten durchgeführt.
Bei einem Dataset mit 170.000 qualifizierten Messreihen wurde mit verschiedenen Klassifizierern und Meta-Parameter Variationen untersucht, ob ein hoher Anteil der Overreads (> 80 %) mit großer Zuverlässigkeit (False-Positiv-Prognosequote < 0,5 %) per ML automatisch klassifiziert werden konnte. Außerdem wurde geprüft, auf welchem Weg (Webservice, ONNX-File) der resultierende ML-Algorithmus optimal für Anwendungen verfügbar gemacht werden konnte.
Die eingesetzen Klassifizierer waren: SVM/Stützvektoren (Gauss, Sigmoid, Maximum Margin, Kernel), k-Nearest Neighbor und Random Forest.
Deep-Learning-Verfahren waren zunächst nicht geplant.   

Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: Python 2.7/3.6, Pandas, scikit-learn, Jupyter-Notebook, Spirometrie
02/2017
Datenanalysen (lfd. Projekt)
Ad-hoc Oracle-Queries zu laufenden klinischen Studien, insbesondere Outlier-Analysen und Untersuchungen zu Sonderfällen, vermeintlichen Fehlern und absichtlicher Täuschung. Zur Abfrage der Oracle-Datenbanken wird DBeaver eingesetzt. Das Reporting erfolgt in csv oder Excel.
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: Microsoft Excel 2013, PL/SQL, DBeaver, Statistische Verfahren
05/2018
Datawarehouse - laufende Weiterentwicklung
Pflege und Erweiterung eines Datawarehouse's zum Monitoring der laufenden klinischen Studien. Neu (im technischen Sinne) ist die schrittweise Umstellung des Reportings von MS SQL-Server Reporting Services und Sharepoint nach Power BI.    
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: Power BI
11/2017 - 05/2018
Datawarehouse-Migration
Migration eines komplexen DWHs mit vielfältigen Datenquellen von MS-SQL 2008 R2 SSIS auf MS-SQL 2017 SSIS.
Dieses Projekt war besonders schwierig, weil der vorherige Entwickler nicht mehr verfügbar war und es keine Dokumentation gab.
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: Microsoft Visual Studio 2015, Microsoft SQL Server 2017, Microsoft Team Foundation Server 2010, Oracle 12c, Microsoft SSIS 2017, C#
05/2017 - 11/2017
Datenbankentwicklung. SCRUM-Pilotprojekt
Entwicklung einer einfachen Datenbank (18 Tabellen, 24 Views, 4 Stored Procedures) für eine Webanwendung zur Verwaltung von Schulungen und Zertifikaten (Training Management System). Verwendung von History-Tabellen zur Datenversionierung und für Audittrail-Reportviews.
Pilotprojekt zur agilen Entwicklung an drei Standorten in Deutschland, Russland und Indien.
Branche: Medizin-IT
Rolle(n): Entwickler / Programmierer
Skills: Microsoft SQL Server 2017, Microsoft Visual Studio 2017, JIRA, GIT, Polarion
08/2014
IT-PG ABS: Entwicklung einer Abrechnungs- und Verwaltungssoftware (lfd. Projekt)
(Weiter-) Entwicklung einer Verwaltungsoftware für eine Vertriebsgenossenschaft mit den Modulen:
  • Kontaktverwaltung: Kunden, Lieferanten, Mitglieder
  • Abrechnung: Rechnungen, Gutschriften, Quittungen, etc.
  • Projekte: Verträge, Konditionen, Provisionen, Dokumente
  • Aufgaben, Termine, Emails
  • Bank: Import, Importverarbeitung, Sepa-Sammelüberweisungen, Zahlungsüberwachung, automatische Buchungen
  • Auswertungen

Branche: Personaldienstleistungen
Rolle(n): Entwickler / Programmierer
Skills: PostgreSQL, Microsoft Access 2013
01/2016 - 04/2017
Data Quality Checks
Entwicklung und Pflege von Tools zur Qualitätssicherung von komplexen Datenexporten

Branche: Medizin-IT
Rolle(n): Entwickler / Programmierer
Skills: Microsoft Visual Studio 2008, Microsoft SQL Server 2008 R2, Microsoft SQL Integration Services (SSIS) 2008
05/2011 - 09/2016
Portaldatenbankentwicklung für klinische Studien
Entwicklung und Anpassung komplexer, performanter Datenbankabfragen mit Hilfe von Transact SQL (Stored Procedures, Functions, Common Table Expressions, Views) für medizinische Webportale mit sehr großen Datenmengen aus unterschiedlichen Quellen (Big Data). Entwicklung komplexer Export-Pakete und von Datawarehouse-Komponenten (DWH).
Branche: Pharma
Rolle(n): Entwickler / Programmierer
Skills: Microsoft SQL Server 2008 R2, Microsoft SQL Server Integration Service (SSIS), Microsoft Team Foundation Server 2008/2010
04/2010 - 03/2011
Prototyp: Immobilienbewertungssystem
Objektverwaltung, Mieterverwaltung, Immobilienbewertung nach unterschiedlichen Bewertungs- und Exitstrategien.
Frontend für ca. 250 Clients.
Branche: Immobilienverwaltung
Rolle(n): Entwickler / Programmierer
Skills: MS Access 2007, MS SQL Server 2005, MS Excel 2007
09/2009 - 03/2010
Migration/Erweiterung Schmuckgroßhandelssystem
Migration und Erweiterung einer Warenwirtschaft für den Schmuckgroßhandel von Microsoft Access 97 (Frontend und Backend) auf Microsoft Access 2007 (Frontend) und Microsoft SQL-Server 2008 (Backend).


Branche: Großhandel
Rolle(n): Entwickler / Programmierer, Projekt-Manager
Skills: MS SQL Server 2008 R2, MS Access 2007