打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspark、HiveQL、Scala等脚本的计算中间件。
最近更新: 2年多前一个安全、流畅、极简的远程SVN在线管理系统,解决了需要登录到远程服务器并通过命令行操作才能管理SVN服务器的烦恼,支持远程管理SVN服务器,关键功能操作发送邮件通知到相关人员。
最近更新: 接近3年前大数据平台数据服务框架。实现了Kafka实时数据过滤、清洗、转换、消费,实现了Spark SQL对Redis、MongoDB等非关系型数据库的数据的读写;集成了规则引擎,可基于规则引擎实现客户标签、画像等相关功能。
最近更新: 接近3年前项目主要模块 基于对电商用户行为数据的基本分类,我们可以发现主要有以下三个分析方向: 1. 热门统计 利用用户的点击浏览行为,进行流量统计、近期热门商品统计等。 2. 偏好统计 利用用户的偏好行为,比如收藏、喜欢、评分等,进行用户画像分析,给出个 性化的商品推荐列表。 3. 风险...
最近更新: 接近3年前项目主要模块 基于对电商用户行为数据的基本分类,我们可以发现主要有以下三个分析方向: 1. 热门统计 利用用户的点击浏览行为,进行流量统计、近期热门商品统计等。 2. 偏好统计 利用用户的偏好行为,比如收藏、喜欢、评分等,进行用户画像分析,给出个 性化的商品推荐列表。 3. 风险...
最近更新: 接近3年前采用Nginx+Flume+kafka实现日志收集,Flink进行实时流处理。兼容神策埋点SDK、友盟埋点SDK和其他终端埋点包,完整产品模块包括用户行为分析、用户画像、智慧营销。
最近更新: 接近3年前一个安全、流畅、极简的远程SVN在线管理系统,解决了需要登录到远程服务器并通过命令行操作才能管理SVN服务器的烦恼,支持远程管理SVN服务器,关键功能操作发送邮件通知到相关人员。
最近更新: 4年多前大数据平台数据服务框架。实现了Kafka实时数据过滤、清洗、转换、消费,实现了Spark SQL对Redis、MongoDB等非关系型数据库的数据的读写;集成了规则引擎,可基于规则引擎实现客户标签、画像等相关功能。
最近更新: 4年多前