2021.06.03刘一辰的软件工程随笔
今日目标:
JAVAcheng
今日总结:
class WindowWordCount {
public static void main(String[] args) throws Exception{
SparkConf conf = new SparkConf().setAppName("WindowWordCount");
// create context
JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(10));
// kafka properties map
Map<String, String> KafkaParams = new HashMap<String, String>();
KafkaParams.put("bootstrap.servers", "hserver-1:9092,hserver-2:9092,hserver-3:9092");
KafkaParams.put("group.id", "WindowWordCount");
KafkaParams.put("auto.offset.reset", "smallest");
// kafka topic set
Set<String> topics = new HashSet<String>();
topics.add(args[0]);
// access data DStream
JavaPairInputDStream<String, String> SearchLogDStream =
KafkaUtils.createDirectStream(
jssc,
String.class,
String.class,
StringDecoder.class,
StringDecoder.class,
KafkaParams,
topics
);
// flatMap
JavaDStream<String> WordDSteram =
SearchLogDStream.flatMap(
new FlatMapFunction<Tuple2<String,String>, String>() {
private static final long serialVersionUID = 4034522628037914742L;
@Override
public Iterator<String> call(Tuple2<String, String> tuple) throws Exception {
return Arrays.asList(tuple._2.split(" ")).iterator();
}
});
明日目标:
mapToPair
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!