佩德罗·恩里克·罗查·梅,美国佛罗里达州迈阿密的开发人员
Pedro is available for hire
Hire Pedro

佩德罗·恩里克·罗查·梅

Verified Expert  in Engineering

机器学习开发人员

Location
迈阿密,佛罗里达州,美国
至今成员总数
April 25, 2019

Pedro是一位面向业务的经验丰富的数据科学家和数据工程师,具有大规模构建和部署生产分布式数据管道和机器学习模型的经验, 涵盖从设计开始的整个数据生命周期, construction, optimization, deployment, 以及数据架构和机器学习模型的监控. Pedro的重点是交付解决方案,这些解决方案对环境和数据的变化具有健壮性,并且能够灵活地应对业务需求的变化.

Portfolio

Rocha Moy贸易公司
Python, Julia,亚马逊网络服务(AWS),期权交易,api,网页抓取...
Self-employed
Scikit-learn, SpaCy, GPT,自然语言处理...
Toptal Client
Python, Amazon Elastic MapReduce (EMR), Spark, Snowflake

Experience

Availability

Full-time

首选的环境

Python, Scala, 亚马逊网络服务(AWS), 工程数据, Data Science, 机器学习, Big Data, 软件架构

最神奇的...

...我建立的系统是算法和概率交易系统. 由于对世界的看法有限,概率是风险管理的重要工具.

Work Experience

Chief Architect

2017 - PRESENT
Rocha Moy贸易公司
  • 与Interactive Brokers和TD Ameritrade合作开发概率和算法期权交易API. 专长包括数据集成, task automation, 投资组合模拟, risk mitigation, 策略验证.
  • 集成了许多不同的数据源,从api到网页抓取.
  • 自动交易执行,交易调度,交易资金释放完全.
技术:Python, Julia,亚马逊网络服务(AWS),期权交易,api,网页抓取, 概率论, 机器学习, Simulations, 数据集成

首席数据科学家

2021 - 2022
Self-employed
  • 设计、实现和部署不同的自然语言处理模型.
  • 与涉众一起工作以理解用例, 产品开发的途径, 以及使用已部署模型的实现.
  • 指导和支持团队中的初级数据科学家.
技术:Scikit-learn, SpaCy, 自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Neural Networks, XGBoost

企业首席数据架构师-承包商

2020 - 2022
Toptal Client
  • 处理架构, development, 分布式计算管道的自动化和企业云中的数据存储.
  • 云中的自动化可伸缩基础设施,以响应开发和用户需求.
  • 共同管理和监督工程师团队的设计和委派任务, mentoring, 监督工作.
技术:Python, Amazon Elastic MapReduce (EMR), Spark, Snowflake

企业高级ETL和数据工程师-承包商

2019 - 2020
Toptal Client
  • Designed, implemented, 并在Spark/Scala API中部署到生产中成熟的分布式ETL作业.
  • 处理各种数据源和数据汇,包括绝望文件, Hive tables, Mongo集合, 和Kafka代理.
  • 担任团队的高级工程师和技术主管,加强工程和开发流程, 改进软件质量控制, 并帮助设计sprint的故事.
技术:Oracle SQL, DocumentDB, Scala, Python, MongoDB, Spark SQL, Spark, Apache Kafka, Hadoop

Hadoop大气科学项目的概念证明-承包商

2019 - 2020
Toptal Client
  • 从零开始构建集群,坚持客户端需要与家庭集群一起工作.
  • 设计和实现通用和特定的数据架构,以满足客户端查询的复杂性和性能需求.
  • 构建PySpark和Python软件抽象层,允许客户端在当前基础架构之上构建.
技术:PySpark, Hadoop

研究数据工程师

2018 - 2019
尼克劳斯儿童医院
  • 为R用户开发现有的分析和数据工作流程, Python, 和英帕拉建立最佳工程实践.
  • 提供临时和系统地开发ETL和大数据管道, validation, 以及不同数据源的集成.
  • 为研究部门与IT和BI部门联系,就分析和数据需求提供指导和专业知识.
技术:Impala, Hadoop, Spark, Scala, Python

技术顾问

2018 - 2018
Insight数据科学
  • 在问题定义方面与同事和他们的数据工程项目合作, 系统架构, and execution.
  • 熟悉Spark、Kafka、Redis、HBase、Cassandra、PostgreSQL等技术.
  • 就可伸缩性概念、算法和CS基础与同事进行模拟面试.
技术:PostgreSQL, Cassandra, HBase, Redis, Apache Kafka, Spark

高级软件工程师

2016 - 2017
NexHealth
  • 开发和部署软件到客户的站点,以执行数据收集和服务器同步.
  • 将电子医疗记录与NexHealth服务器进行数据库和基于web的数据集成.
  • 开发智能短信响应系统,允许用户通过短信与NexHealth产品互动.
技术:Redis, PostgreSQL, Apache Spark, JavaScript, Scala, Python, Ruby on Rails (RoR)

Data Scientist

2016 - 2016
QuaEra Insights
  • 在一个监督数据管理和建模策略的咨询项目中担任首席数据科学家.
  • 利用自然语言处理将非结构化数据转换为特征,提取商业智能.
  • 构建一个推荐引擎作为业务规则,可能会节省高达50%的业务成本.
技术:Python

数据工程研究员

2015 - 2015
Insight数据科学
  • 建造了比赛中场管, 该平台旨在发现YouTube上对全球品牌有影响力的人.
  • 部署Amazon的EMR Spark与HBase一起处理和摄取数十亿的数据元组.
  • 在多达20个节点的测试中获得线性可伸缩性性能.
技术:亚马逊网络服务(AWS)、Bootstrap、Hadoop、Apache Spark、Python

Data Analyst

2015 - 2015
Cartesian
  • 辅助管理分析工作,促进批处理工作流和数据管理中的最佳实践.
  • 独立研究大数据工作流,考虑数据挖掘和BI集成.
  • 构建使用api的短数据管道, transforming, loading, 并向BI工具公开数据连接.
技术:Alteryx, PostgreSQL, R, Python,数据分析,管理分析

数据分析工程师

2013 - 2015
Daktari诊断
  • 在Windows/Mac平台的Python中担任主流数据处理和数据分析应用程序的首席开发人员.
  • 开发了Daktari CD4检测设备的校准模型,使系统精度提高了20-30%.
  • 将部署的机器学习模型嵌入到独立应用程序中,以供最终用户进行数据分类.
技术:Microsoft SQL Server, JMP, SAS, R, Python

持续边缘和套期保值股票交易策略

http://docs.google.com/presentation/d/1zkbfErfwbJvGBXFj9UWKDvq99wkj6EBvqniA4yFNu68/edit?usp=sharing
本研究探讨了强化学习代理作为一种产生多样化策略集的手段,以保证在任何市场条件下现有的最优策略. 初步结果表明,代理池提供了理想的多样性,将算法交易挑战转化为选择问题(可以用进化计算等人工智能方法解决)。.
2021 - 2022

工商管理高级工商管理硕士

迈阿密大学-迈阿密

2015 - 2017

计算机科学(机器学习)硕士学位

佐治亚理工学院-亚特兰大,乔治亚州

2010 - 2012

地球科学与工程(地球物理学)硕士学位

阿卜杜拉国王科技大学-沙特阿拉伯

2008 - 2010

机械工程学士学位

麻省大学洛厄尔分校

Libraries/APIs

微软HPC, PySpark, TensorFlow, PyTorch, Scikit-learn, XGBoost, Dask, SpaCy

Tools

ChatGPT, Amazon Elastic MapReduce (EMR), Spark SQL, JMP, Impala, Git, Gensim

Languages

Python, Julia, Scala, SQL, R, SAS, JavaScript, Bash, Snowflake

Storage

NoSQL, MongoDB, Oracle SQL, Microsoft SQL Server, Redis, Cassandra, PostgreSQL, HBase, Apache Hive, 数据集成

行业专业知识

Accounting

Paradigms

函数式编程,并行编程,分布式计算,数据科学

Platforms

Docker, Jupyter Notebook, Apache Kafka, Alteryx, Linux, 亚马逊网络服务(AWS)

Frameworks

Bootstrap, Ruby on Rails (RoR), Spark, Apache Spark, Flask, Hadoop, Streamlit

Other

机器学习, 分布式系统, OpenAI GPT-4 API, 金融建模, Web App UI, APIs, 数据架构, Data Modeling, DocumentDB, Dash, Deep Learning, 自然语言处理(NLP), 工程数据, 人工智能(AI), Algorithms, 算法交易, Optimization, 强化学习, 时间序列分析, Forecasting, Cloud, 数值优化, 情绪分析, Neural Networks, Options Trading, Web Scraping, 概率论, Simulations, Finance, Law, Entrepreneurship, Leadership, Big Data, 软件架构, GPT, 生成预训练变压器(GPT), Data Analytics, 管理分析

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring