360西安研发中心招聘大数据人才,欢迎想在西安发展的朋友咨询!

60系统部是360集团公司大数据基础架构团队,负责公司大数据和人工智能平台的建设,旨在为公司的业务部门提供统 […]
lxw的大数据田地 2018年08月17日
其他 招聘

单机安装配置ElasticSearch6.3集群,体验es-sql

S6.3发布之后,带来了很多新特性,https://www.elastic.co/blog/elastics […]
lxw的大数据田地 2018年08月17日
ElasticSearch elasticsearch

360西安研发中心招聘大数据人才,欢迎想在西安发展的朋友咨询!

60系统部是360集团公司大数据基础架构团队,负责公司大数据和人工智能平台的建设,旨在为公司的业务部门提供统 […]
lxw的大数据田地 2018年07月29日
其他 招聘

SaltStack简介及安装配置

altStack是一款开源的,基于Python的自动化运维工具,通过SaltStack,我们可以在成千上万台 […]
lxw的大数据田地 2018年07月26日
大数据平台 自动化运维

大规模集群下使用P2P技术软件(Murder)分发大文件

般情况下,在运维多台服务器的时候,使用Ansible来完成文件的分发和命令的执行。但如果运维的机器数量多,而 […]
lxw的大数据田地 2018年07月22日
大数据平台 自动化运维

《阿里技术参考图册》下载

阿里技术参考图册》(算法篇)下载:https://102.alibaba.com/downloadFile. […]
lxw的大数据田地 2018年04月20日
大数据平台

官方教程:Apache Kylin和Superset集成,使用开源组件,完美打造OLAP系统

文转自Apache Kylin公众号apachekylin. Superset 是一个数据探索和可视化平台, […]
lxw的大数据田地 2018年03月27日
Kylin 大数据平台 数据仓库/数据库 superset

实时流计算、Spark Streaming、Kafka、Redis、Exactly-once、实时去重

文想记录和表达的东西挺多的,一时想不到什么好的标题,所以就用上面的关键字作为标题了。 在实时流式计算中,最重 […]
lxw的大数据田地 2018年02月22日
Spark 大数据平台 kafka spark

Flume的监控(Monitor)

用Flume实时收集日志的过程中,尽管有事务机制保证数据不丢失,但仍然需要时刻关注Source、Channe […]
lxw的大数据田地 2018年02月12日
Flume flume

数据可视化概览

:本文转载自 https://antv.alipay.com/zh-cn/vis/blog/vis-intr […]
lxw的大数据田地 2018年01月11日
大数据平台 数据可视化

数据仓库之数据模型

于数据仓库的概念,这里不再累赘。先看下面的图(数据仓库建设的7个主要环节): 本文,主要针对第三块数据仓库模 […]
lxw的大数据田地 2018年01月11日
大数据平台 数据仓库/数据库 数据仓库

Apache Storm简介及安装部署

pache Storm是一个分布式的、可靠的、容错的实时数据流处理框架。它与Spark Streaming的 […]
lxw的大数据田地 2017年11月22日
Storm 大数据平台 storm

机器学习中的数据清洗与特征处理

:本文转载自 https://tech.meituan.com/machinelearning-data-f […]
lxw的大数据田地 2017年11月13日
大数据平台 数据仓库/数据库 机器学习 特征工程

日志实时收集之FileBeat+Kafka

前,我们的某一个业务用于实时日志收集处理的架构大概是这样的: 在日志的产生端(LogServer服务器),都 […]
lxw的大数据田地 2017年11月09日
大数据平台

Presto简介及安装部署–备忘

resto简介 Presto是一个由Facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量 […]
lxw的大数据田地 2017年09月25日
大数据平台

订阅源