项目名称: |
Search Funnel |
项目描述: |
该项目是微软总部的数据分析项目,主要针对微软MSN搜索引擎的数据进行分析,建立数据仓库,找出查询关键词之间的关联关系。 |
项目大小: |
7人 |
项目时间: |
2004年5月-2004年12月 |
担任角色: |
ETL工程师 |
工作内容: |
负责后台全部数据仓库的整体架构,流程实现。 该项目的难点是海量数据的处理,完成了MSN一个月的数据处理,数据量为18亿条,针对海量数据做了相当多的优化工作。 |
开发工具: |
SQL Server 2000,C# 2003,PD,VSS,Visio |
|
|
项目名称: |
Microsoft Marketing Log Data Analysis |
项目描述: |
该项目是基于微软全球146个国家的数据进行数据分析,建立点击流数据仓库,进行报表分析,数据统计和数据挖掘。 |
项目大小: |
8人 |
项目时间: |
2005年1月-2005年6月 |
担任角色: |
项目负责人,PM |
工作内容: |
该项目历时半年,由我与微软总部客户Jim Yang高级项目经理每星期沟通一次,中国方面我来负责,包括Extract, Transformation, Cleansing And Loading等工作。 |
开发工具: |
SQL Server 2005 Integration Servers,SQL Server 2005 Analysis Servers,SQL Server 2005 Reporting Servers,C# 2005 Beta 3,PD,Visio,VSS,ProClarity,ProClarity Analysis Servers |
|
|
项目名称: |
Microsoft Website Search |
项目描述: |
该项目是基于微软全球网站搜索数据进行数据挖掘。包括词频统计、相似度分析、入口分析等,自行编写分析挖掘软件。 |
项目大小: |
5人 |
项目时间: |
2005年1月-2005年6月 |
担任角色: |
项目负责人,PM |
工作内容: |
带领5人实施该项目。从开始的需求分析,到流程架构,项目实施,作为负责人,完成与客户的英语交流,英文文档,项目前期准备工作,项目源码管理,项目实施等工作。 |
开发工具: |
SQL Server 2000,C# 2003,PD,Visio,VSS |
|
|
项目名称: |
Keyword Association Graph |
项目描述: |
该项目是基于微软总部MSN搜索引擎数据进行关键词Association Rule分析。该项目是美国微软总部的演示项目,使用了世界上先进的Ajax等技术。 |
项目大小: |
5人 |
项目时间: |
2006年7月-2006年9月 |
担任角色: |
数据仓库负责人 |
工作内容: |
负责后台所有架构,代码的实现。包括建立处理规则,索引与分区等的实现。 |
开发工具: |
SQL Server 2005 Beta 1,C# 2005 Beta 1,PD,VSS,Visio,Ajax相关工具。 |
|
|
项目名称: |
Microsoft Questions Text Data Mining |
项目描述: |
文本挖掘项目,该项目是对微软总部的调查数据进行文本挖掘。 |
项目大小: |
3人 |
项目时间: |
2005年6月-2005年7月 |
担任角色: |
项目负责人,PM |
工作内容: |
带领3人实施该项目。从准备工作,到关键词提取,禁用词与同义词的清理,最后到得出最终挖掘结果,时间为3周。 |
开发工具: |
SQL Server 2005 Integration Servers,C# 2005,PD,Visio,VSS |
|
|
项目名称: |
新浪网数据仓库项目 |
项目描述: |
基于新浪网海量的网站数据建立数据仓库,进行多维分析和数据挖掘。 |
项目大小: |
13人 |
项目时间: |
2005年6月-2005年12月 |
担任角色: |
ETL工程师 |
工作内容: |
在项目中负责ETL,参与建立CUBE,使用进行ProClarity报表分析,使用SQL Server 2005 Data Mining工具进行数据挖掘。 |
开发工具: |
SQL Server 2005,ProClarity,PD |
|
|
项目名称: |
昆仑亿发Survey项目 |
项目描述: |
该项目是昆仑亿发公司的OLAP项目,全部程序编码实现。使用了AMO等技术。 |
项目大小: |
3人 |
项目时间: |
2006年1月-2006年2月 |
担任角色: |
项目负责人,PM |
工作内容: |
自主开发AS下建立CUBE的代码,使用AMO等技术,并进行维护和添加新的功能等工作。 |
开发工具: |
Oracle,BO,AMO,PD |
|
|
项目名称: |
承德钢铁公司数据挖掘项目 |
项目描述: |
基于承德钢铁公司Oracle的ERP数据源上Business Intelligence项目,进行数据分析和数据挖掘。 |
项目大小: |
18人 |
项目时间: |
2005年6月-2005年10月 |
担任角色: |
ETL工程师 |
工作内容: |
在项目中负责售前培训,数据仓库逻辑模型与物理模型建立,进行ETL工程,搭建OLAP,建立多维数据库,进行报表和挖掘。 |
开发工具: |
Oracle,Informatica,Oracle Warehouse Brower,Java,Sybase Essbase,BO,PD,Rose,SPSS |
|
|
项目名称: |
华为固话数据分析 |
项目描述: |
该项目是对深圳华为公司固话数据进行数据分析,按不同维度进行分析,找到消费时间段等信息。处理的数据需要按分钟进行调度,难度比较大,通过数据仓库性能优化,达到了所需要的效果和要求。 |
项目大小: |
15人 |
项目时间: |
2004年1月-2004年6月 |
担任角色: |
ETL工程师 |
工作内容: |
负责数据仓库设计,ETL流程处理及调度,数据仓库的性能优化。 |
开发工具: |
Oracle,PD,Informatica |
|
|
项目名称: |
中原房地产数据挖掘 |
项目描述: |
该项目是对上海中原房地产公司销售数据建立数据仓库,进行数据分析和挖掘,查找最有价值客户和最有价值房源等信息。 |
项目大小: |
7人 |
项目时间: |
2004年6月-2004年12月 |
担任角色: |
数据仓库负责人 |
工作内容: |
负责后台数据仓库建立,代码的实现。包括建立处理规则,索引与分区等的实现以及ETL流程处理及调度。 |
开发工具: |
Oracle,PD,Informatica,SPSS |
|
|
项目名称: |
天士力医药集团POC项目 |
项目描述: |
该项目是对天津天市力医药集团的销售数据进行数据分析,根据DEMO数据建立POC项目模型,根据建立的数据仓库模型进行报表分析。 |
项目大小: |
4人 |
项目时间: |
2004年7月-2004年11月 |
担任角色: |
数据仓库负责人 |
工作内容: |
负责后台数据仓库模型建立,ETL过程。 |
开发工具: |
Oracle,PD,OWB,BO |
|
|
项目名称: |
北京星际空间科技有限公司数据库设计和优化项目 |
项目描述: |
进行数据库设计和调优,该项目是针对北京星际空间科技有限公司在全国近万家网吧的数据进行数据库设计和优化。 |
项目大小: |
3人 |
项目时间: |
2006年7月-2006年8月 |
担任角色: |
数据库工程师 |
工作内容: |
独立进行数据库的设计工作,包括性能调优,海量数据优化调优等工作。 |
开发工具: |
Oracle,Java,PD,Rose |
|
|
项目名称: |
Novartis ETL Project |
项目描述: |
瑞士Novartis公司大型ETL项目,对多系统,多数据源数据进行集成,综合运用了缓慢变化维度等各种复杂技术,项目周期长,处理流程复杂。 |
项目大小: |
8人 |
项目时间: |
2006年11月-2007年5月 |
担任角色: |
项目经理 |
工作内容: |
带领团队进行ETL项目设计与开发,负责与客户沟通,工程项目人员任务分配,检查等。 |
开发工具: |
SQL Server 2005,Cognos |
|
|