关于我们

“DeePhi Tech”

深鉴科技,致力于为全世界提供更便捷、更高效、更经济的深度学习平台解决方案。深鉴由斯坦福大学与清华大学的深度学习硬件加速研究者创立,也汇聚了来自百度、360、西门子、诺基亚等公司的架构师与市场运营团队。深鉴坚信算法、软件、硬件的协同优化是深度学习的发展方向,产品和用户的快速迭代是公司发展的推动力。我们的目标,则是成为人工智能时代全球领导性的深度学习平台提供者,加速前沿创新的同时深耕应用和市场,让深度学习赋予世界的每个节点智慧。

技术介绍

深鉴科技具备世界领先的神经网络压缩编译工具链、深度学习处理器DPU设计、FPGA开发与系统优化等技术能力。团队一系列研究工作发表于NIPS 2015,ICLR 2016,FPGA 2016,ISCA 2016,NIPS 2016 Workshop,FPGA 2017等顶级会议,并与DeepMind共同获得ICLR 2016最佳论文、NIPS 2016 Workshop on EMDNN最佳论文提名。深鉴科技于Hot Chips 2016向世界介绍了自己的全套技术流程。

神经网络剪枝压缩

深度学习编译器

CNN 处理器

DNN/RNN 处理器

团队介绍

深鉴科技由包括清华首批 tenure 及 FPGA 亚太区唯一 TPC 成员在内的清华大学 与斯坦福大学的深度学习硬件科学家创立,也凝聚了来自百度、西门子、诺基亚等公司的架构师与市场运营团队。 目前,深鉴科技已获得世界顶级风投的天使轮,并受到多家世界顶级风投关注, 与中美多家顶级企业建立了合作关系,正在快速发展。

姚颂

姚颂

创始人 CEO

毕业于清华大学电子工程系

斯坦福大学访问研究

曾任清华大学电子系科协主席

Hot Chips最年轻演讲者

单羿

单羿博士

合伙人 CTO

清华大学电子工程系&伦敦帝国理工联合培养博士

IBM PhD Fellowship

前百度IDL异构计算方向创始成员

前地平线机器人FPGA技术负责人

韩松

韩松

创始人

清华大学电子工程系毕业

斯坦福大学电子工程系博士

引领世界深度学习压缩与硬件加速研究

ICLR 2016最佳论文

FPGA 2017最佳论文

汪玉

汪玉博士

创始人

清华大学电子工程系副教授&党委副书记

10年硬件加速研究

ACM FPGA技术委员会亚太地区唯一成员

ACM杰出演讲者

产品与应用场景

深鉴科技致力于为全世界提供更便捷、更高效、更经济的深度学习平台解决方案。我们相信,在未来的智能时代,无论是大数据云平台还是每台智能终端,如手机、电脑、家电、安防监控摄像头,都必将需要低功耗、高性能的智能计算平台。深鉴科技着眼于无人机/机器人、安防监控、数据中心,已经将技术全面应用于实际产品。

视频展示

合作伙伴

深鉴科技已经与多家公司合作,完成了初步市场探测,随着全球范围内大数据和人工智能产业的发展,公司产品将面临巨大的市场空间和发展前景。

合作伙伴


投资者关系




媒体报道

合作伙伴

联系我们

partner@deephi.tech
dream@deephi.tech

加入深鉴

dream@deephi.tech

招聘职位:

01. 深度学习处理器工具链工程师

岗位职责:

1. 基于深度学习处理器DPU研发高效编译器工具链,包括 Compiler/Code-generator/Assembler/Simulator/Linker/Loader等;

2. 参与DPU的架构设计和优化工作;

3. 为DPU开发IDE,集成相关编译器工具链;

4. 负责DPU编译器工具链的QA验证工作;

5. 负责DPU编译器工具链相关技术文档的编写;

职位要求:

1. 重点高校计算机或相关专业本科以上学历,3年以上相关工作经验;

2. 精通C/C++编程,具有扎实地产品化软件研发经验,Linux环境下熟练开发/调试/测试;

3. 具备深厚的计算机体系结构研究背景,熟悉各种基本的数据结构和算法;

4. 具备GCC、LLVM或Open64等编译器研发背景者优先;

5. 具备DSP/GPU等异构计算平台下工具链研发经验者优先;

6. 具备CNN等深度学习算法背景知识或研发经验者优先;

7. 要求责任心强,有良好的学习能力和协作精神,愿意接受挑战和承受工作压力。

02. IC验证工程师

岗位职责:

1. 负责SoC验证环境的维护和更新;

2. 负责SoC模块级验证;

3. 负责功能覆盖率的收集和分析;

4.  负责相应脚本的维护和更新;

职位要求

1. 有SoC或复杂IP规范化验证经验;

2. 熟悉验证标准流程; 

3. 熟练使用Verilog/ System Verilog等;

4. 熟练使用UVM/ OVM/ VMM方法学;

5. 熟悉C/ C++/ SystemC;

6. 至少能熟练使用一种脚本,包括并不限于python, Perl, Makefile,各种Shell等;

7. 使用过Synopysys/ Cadence的VIP是加分项

03. IC前端工程师

岗位职责:

深度学习处理器芯片前端设计与实现。

职位要求:

1. 微电子/电子/计算机相关专业;

2. 熟练掌握Verilog语言与设计实现;

3. 熟悉功能验证,综合以及时序分析等芯片设计流程;

4. 工作认真踏实,有钻研学习能力,具备独立解决问题的能力;

5. 具备如下经验者将会被优先考虑:

- 熟悉ARM SOC架构,熟悉AMBA/AHB/APB/AXI协议

- 熟悉基于ARM SOC的FPGA开发

- 熟悉perl/tcl/shell等脚本语言

- 熟悉IC FE Flow相关EDA工具

04. 系统软件工程师

岗位职责:

1. 负责硬件平台的系统软件架构设计和解决方案;

2. 独立完成Linux系统的移植,驱动和应用程序开发;

3. 根据应用场景,灵活调整系统配置和软件模块的增减;

4. 与硬件,算法以及应用软件团队紧密合作,优化系统性能和可靠性;

5. 根据产品功能模块设计,编码实现各模块功能,并确保开发质量与进度;

6. 负责软件的设计、编程、调试和模块测试工作。

职位要求:

1. 本科及以上学历,有3-5年以上嵌入式软件开发工作经验;

2. 精通C/C++语言,有扎实的编程功底和编程经验;

3. 精通Bootload (U-boot) 和Linux底层驱动开发;

4. 精通Linux多线程编程;

5. 熟悉一种或多种ARM SOC平台开发(熟悉Xilinx Zynq优先考虑);

6. 熟悉一种或多种接口开发,包括USB,I2C,SPI,I2S,MIPI CSI,MIPI DSI等;

7. 熟悉视频编解码标准和实际应用,有海思IPC/NVR芯片开发经验优先;

8. 熟悉TCP/IP、RTP/RTSP/HTTP等网络传输协议以及蓝牙、WIFI等无线传输协议;

05. C++高级研发工程师

岗位职责:

1. 开发针对深度学习处理器(DPU)的相关工具,包括编译器、计算仿真工具等,让DPU可以更好的应用在产品中;

2. 和深度学习算法研究人员以及硬件人员充分交流,提出更好的软件优化方案;

3. 编写相关的设计和开发文档。

职位要求:

1. 计算机或软件相关专业本科以上学历;3年以上C++开发经验;

2. 熟悉Linux系统操作和开发工具,能熟练使用Git、CMake等工具;

3. 具备Python等脚本语言开发经验者优先;

4. 要求责任心强,有良好的学习能力和协作精神,愿意接受挑战和承受工作压力。

06. 神经网络压缩算法研究工程师

岗位职责:

1. 研究神经网络的压缩算法,阅读、复现已有方法,开发新型压缩方法;

2. 对神经网络的压缩算法进行分析,测试和改进。

职位要求:

1. 计算机视觉/图像处理/机器学习等相关方向;

2. 熟悉Linux下的C/C++ 编程;

3. 熟悉至少一种深度学习算法,例如 CNN 或者 LSTM 等;

4. 熟悉至少一种深度学习框架,包括 Caffe等;

5. 具备钻研精神和创造力,能够通过阅读论文学习最新算法和理论;

6. 要求责任心强,有良好的学习能力和协作精神,愿意接受挑战和承受工作压力要求;

7. 在CVPR/ICCV/ECCV/NIPS/ICLR/TPAMI等相关顶级学术会议期刊发表过相关论文者优先。

07. 视觉算法研发工程师

岗位职责:

1. 研究深度学习(包括各种神经网络结构与应用)或计算机视觉各个领域(目标检测识别等)中核心算法;

2. 将上述核心算法应用到各种复杂现实场景中,如无人机,机器人,智能监控等;

3. 针对应用场景进行数据分析和算法优化;

4. 编写相关算法分析和优化报告。

职位要求:

1. 计算机视觉、图像处理、机器学习等相关方向;具有三年以上算法研究经验;

2. 熟悉至少一种深度学习算法,例如CNN或者LSTM等;

3. 熟悉至少一种深度学习框架,包括Caffe等;

4. 具备相关应用背景者优先,例如做过目标检测、跟踪、识别等应用项目;

5. 具备钻研和创造力,能够通过阅读论文学习最新算法和理论;

6. 要求责任心强,有良好的学习能力和协作精神,愿意接受挑战和承受工作压力要求;

7. 在CVPR,ICCV,ECCV,NIPS,ICLR,TPAMI等相关顶级学术会议期刊发表过相关论文者优先。

08. 政府关系经理

岗位职责:

1. 配合公司整体的公共事务战略,建立完善与政府机构沟通机制,与相关政府部门、战略合作伙伴建立并维持良好的互动关系;

2. 整合公司内部资源,获取政策优势,负责政府相关项目的申报,流程对接,项目执行等;

3. 代表公司参与相关公共事务活动,提升公司在相关政府层面的认知度及品牌形象;

4. 了解北京政府相关法律法规,及时更新公司信息以及协助业务部门推进工作;

5. 负责公司政府项目的组织实施,包括与相关政府部门的沟通联系等。

职位要求:

1. 统招本科以上学历,计算机、通信相关专业优先;3年以上政府关系、公关等相关职位工作经验;

2. 具备良好的政府关系资源,较强的沟通表达能力,商务谈判能力,协调能力以及抗压能力;

3. 对政府政策和中央部委主要政府部门有深入了解,熟悉相关政府职能部门能够根据工作需要快速拓展相关人际关系网络;

4. 熟悉人工智能领域,有相关企业从业经验者优先。

09. 市场推广经理

岗位职责:

1. 项目开拓、新渠道发掘、提升已有渠道业务量;

2. 项目商务推广模式、方案的制定及执行;

3. 配合产品部门实施有效的市场推广;

4. 能够策划、沟通、执行相应的市场推广活动;

5. 项目日常维护。

职位要求:

1. 本科及以上学历,理工科、商科相关专业优先;

2. 谈判能力出众,文字表达能力及沟通表达能力强;

3. 充满使命感和创业激情,能承受较大工作压力;

4. 具备较强的市场推广策策划,营销,推广能力和良好的人际交流沟通,协调能力,分析和解决问题的能力;

5. 富有团队合作意识,有较强的学习能力;

6. 能适应不定期出差。

10. 销售经理

岗位职责:

1. 根据市场营销计划,开拓新市场,发展新客户;

2. 负责年度销售的预测,目标的制定及分解;

3. 确定销售部门目标体系和销售配额;

4. 管理维护客户关系以及客户间的长期发展战略;

5. 与客户保持良好沟通,事实把握客户需求。为客户提供热情满意的服务;

6. 有一定的应变能力和组织协调能力;

7. 带领团队完成业绩目标;

职位要求:

1. 专科及以上学历,专业不限;

2. 至少5年无人机、机器人、安防监控、数据中心等相关销售行业工作经验,有销售管理工作经历者优先;

3. 具有丰富的客户资源和客户关系,业绩优秀;

4. 具备较强的市场分析、营销、推广能力和良好的人际沟通、协调能力,分析和解决问题的能力;

5. 有较强的事业心,具备一定的领导能力;

6. 有团队合作精神,具有较强的逻辑思维能力和接受能力,沟通和协调能力较强。

11. 知识产权经理

岗位职责:

1. 负责知识产权(专利、商标、著作权、产品登记、技术查新等)的管理工作,包括:组织申报、跟踪协调、维护管理等;

2. 著作权登记事务的委托手续办理、文档处理、流程跟踪;

3. 处理公司商标转让、许可使用、变更注册人名称或地址、补发注册证等事务;

4. 结合公司发展,对公司商标注册申请及布局进行战略性规划,提高公司知识产权保护水平,防范法律风险,保护公司利益;

5. 与公司其他部门协调工作,提供知识产权法律支持,包括法律咨询、法律风险防范、法律架构设计等;

职位要求:

1. 本科及以上学历,法律专业(具备知识产权相关知识),通过司法考试或曾取得律师执业资格证者优先;

2. 3年以上企业商标管理经验,能够独立处理企业商标事务;

3. 熟悉专利、商标、软件著作权等相关业务流程,有事务所工作经验优先;

4. 具备一定的企业知识产权发展、保护等战略意识及创新能力;

5. 具有良好的团队协作意识及沟通能力。

12. 数据中心销售

岗位职责:

1. 负责公司数据中心行业的重点客户商务拓展工作,销售解决方案、拓展市场、管理客户关系,扩展公司的行业影响力;

2. 调研、分析市场,为公司的营销决策提供依据。

职位要求:

1. 本科以上学历,3年以上数据中心行业大客户管理或商务拓展经验;具备BAT资源优先;

2. 具有较强的商务谈判能力;

3. 较强的商务拓展能力和客户关系维护能力;

4. 具备较强的团队合作能力。

13. 安防销售/商务

岗位职责:

1. 负责公司安防行业的重点客户商务拓展工作,销售解决方案、拓展市场、管理客户关系,扩展公司的行业影响力;

2. 调研、分析市场,为公司的营销决策提供依据。

职位要求:

1. 本科以上学历,3年以上安防行业大客户管理或商务拓展经验;具备公安、政府资源优先;

2. 具有较强的商务谈判能力;

3. 较强的商务拓展能力和客户关系维护能力;

4. 具备较强的团队合作能力。

14. 品牌总监

岗位职责:

1. 负责公司全线产品品牌策划,针对公司需求制定相应的战略规划、品牌定位、营销策略、及带领团队执行品牌创意及营销策划工作;

2. 制定内部战略发展和业务计划,审核策划方案与创意,具备品牌策划的系统认知与见解;

3. 结合产品品牌及营销优势,制定品牌包装策略、推广策略、拓展品牌推广渠道;

4. 策划公众营销事件,参与公司的品牌推广及营销策划;

5. 通过多渠道品牌合作推广,不断提升产品及公司的影响力知名度。

职位要求:

1. 5年上品牌管理经验,具有市场营销、品牌管理、品牌策略、市场策划等专业知识;

2. 熟悉公关媒体品牌推广运作,具有出色的品牌策略能力及整合传播技巧;

3. 出色的沟通交流能力、思维敏捷和理解能力;

4. 优秀的创意及资源整合能力,有大型互联网公司品牌从业经验者优先,有知名品牌企业或品牌咨询公司经验者优先。

学术成绩

Presentations


Aug 2016 Hot Chips 2016
[1] "From Model to FPGA: Software-Hardware Co-Design for Efficient Neural Network Acceleration"

Feb 2017 Embedded Neural Network Summit

[2] "Improve the Efficiency of Deep Learning by Algorithm-Hardware Co-Design"

2017 FPGA 2017 Tutorial
[3] "Deep Learning – Tutorial and Recent Trend"

2016 FPL 2016 Tutorial
[4] "Energy-efficient Acceleration for Neuro-inspired Computing On-a-Chip"

2016 ASPDAC 2016 Tutorial
[5] "Machine learning and Neuromorphic Computing Acceleration"

Publications and Awards


2016 ICLR 2016 Best Paper
[1] "Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding"

2017 FPGA 2017 Best Paper
[2] "ESE: Efficient Speech Recognition Engine with Compressed LSTM on FPGA"

2016 NIPS 2016
[3] "ESE: Efficient Speech Recognition Engine with Compressed LSTM on FPGA" Best Paper Honorable Mention in NIPS 2016 Workshop on Efficient Method for Deep Neural Network

2016 ISCA 2016
[4] "EIE: Efficient Inference Engine on Compressed Deep Neural Network"

2016 FPGA 2016
[5] "Going deeper with embedded FPGA platform for convolutional neural network"

2015 NIPS 2015
[6] "Learning both Weights and Connections for Efficient Neural Network"

2017 ICLR 2017
[7] "DSD: Regularizing deep neural networks with dense-sparse-dense training flow"

2017 ICLR 2017
[8] "Trained Ternary Quantization"

2017 IEEE Micro, 2017
[9] "Software-Hardware Co-Design for Efficient Neural Network Acceleration"

2016 ISCA 2016
[10] "PRIME: A novel processing-in-memory architecture for neural network computation in reRam-based main memory"

2016 arXiv preprint:1602.07360
[11] "SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 0.5MB model size"

2016 IEEE Transactions on Emerging Topic in Computing, 2016

[12] "Towards Real-Time Object Detection on Embedded Systems"

2016 ISCAS 2016
[13] "Low power Convolutional Neural Networks on a chip"

2016 ISVLSI 2016 & IEEE Transactions on CAD, 2017

[14] "Angel-Eye: A Complete Design Flow for Mapping CNN onto Customized Hardware"

2016 ESTIMedia, 2016
[15] "Real-time pedestrian detection and tracking on customized hardware"

技术介绍

TECHNOLOGIES

DEEPHI TECH 具备遥遥领先的神经网络压缩、编译、神经网络处理器 DPU 设计、FPGA 开发、 系统集成完整开发能力,相关工作发表于 NIPS、ICLR、FPGA、ISCA 等顶级会议。 由 DEEPHI TECH 开发的神经网络处理器与压缩编译工具已投入使用,迈出从技术走向产品的重要一步。



01. 神经网络剪枝压缩

神经网络极其复杂。Deep Compression 技术将神经网络压缩数十倍而不降低准确率, 大大降低计算复杂度和存储空间,在 CNN、RNN、LSTM 等深度学习模型都得到验证, 让深度学习的高效部署成为可能。

02. 深度学习编译器

不再需要不同算法重新设计硬件。DEEPHI TECH的神经网络处理器指令集与编译器, 一键即可将神经网络模型编译为神经网络处理器所需指令。仅需数分钟,便可高效运行神经网络。

03. DEEPHI TECH CNN 处理器

针对卷积神经网络的处理器,这种网络一般用来处理图像相关的智能问题

DEEPHI TECH CNN 处理器总体体系架构

04. DEEPHI TECH DNN/RNN 处理器

DEEPHI TECH DNN/RNN处理器,针对于经过结构压缩后的神经网络,进行极致高效的硬件加速。 相对于 Intel Xeon CPU 与 Nvidia Titan X GPU,DEEPHI TECH RNN 处理器在计算速度上分别提高189倍与13倍,具有24000倍与3000倍更高能效。

DEEPHI TECH DNN/RNN 处理器总体架构



DEEPHI TECH DNN/RNN 处理器核心计算单元体系架构