

CatChen

我的王国,我一定会让你永垂不朽的

主页 文章 关于
2017-03-30
spark

那些年不懂的spark(2)

partitionBy && s3

1
df.write.partitionBy('date', 'index1', 'index2', 'index3').parquet('some/path/')

阅读全文

  • spark
  • 踩坑日记
2017-03-19
spark

那些年不懂的spark

感悟

spark是一个好东西。流式处理数据,扩容方便,较大程度上的利用机器,学习还是很有必要的。这几个星期的使用,也踩了不少坑。世界上的很多东西,不是难,而是不知道。

阅读全文

  • spark
  • 踩坑日记
2016-08-21
elasticsearch

elasticsearch系列笔记(六) 索引

创建索引

1
2
3
4
5
6
7
8
PUT /my_index
{
"settings" {}
"mappings": {
"type_one":{},
"type_two":{},
}
}

阅读全文

  • elasticsearch
  • 学习
2016-08-12
elasticsearch

elasticsearch系列笔记(五) 结构化查询

结构化查询Query DSL

1
2
3
4
5
6
7
8
9
10
11
GET /_search
{
"query": {
QUERY_NAME: {
FIELD_NAME: {
ARGUMENT: VALUE,
ARGUMENT: VALUE,
}
}
}
}

阅读全文

  • elasticsearch
  • 学习
2016-08-09
elasticsearch

elasticsearch系列笔记(四) 搜索

路由文档到分片

1
shard = hash(routing) % number_of_primary_shards

阅读全文

  • elasticsearch
  • 学习
« Prev1234567Next »

目录

  • c++1
  • docker1
  • elasticsearch6
  • golang3
  • kafka2
  • python2
  • spark4
  • 学习8
  • 折腾2
  • 活着6
  • 读书笔记2
  • 踩坑日记4

标签云

GC c++ docker elasticsearch ganglia golang kafka nagios naxsi nginx oneproxy pyrobuf python script solr spark upstart 学习 工具 技术 生活 监控 翻译 虚拟化 起点 踩坑日记 转折

文章

  • 八月 20181
  • 二月 20181
  • 十二月 20171
  • 十一月 20171
  • 十月 20172
  • 九月 20173
  • 八月 20172
  • 七月 20173
  • 六月 20171
  • 五月 20171
  • 四月 20172
  • 三月 20172
  • 一月 20171
  • 八月 20166
  • 七月 20161
  • 六月 20163
  • 五月 20161
  • 一月 20161
  • 十一月 20153
  • 十月 20151
  • 九月 20154

近期文章

  • tmux
  • 向2017致敬
  • nginx_header
  • script
  • kafka-replication
© 2019 Chan Cat
Powered by Hexo
粤ICP备17048147号-2
主页 文章 关于