05 2019 档案

搜索广告CTR预估
摘要:https://www.cnblogs.com/futurehau/p/6184585.html 1. CTR预估的流程 数据 -》 预处理 -》特征抽取 -》模型训练 -》后处理 特征决定了达到好的评价指标的上限,模型决定了接近这个上限的程度。 2. 数据预处理 label匹配:展示日志和点击日志 阅读全文

posted @ 2019-05-28 11:55 吱吱了了 阅读(480) 评论(0) 推荐(0) 编辑

pig学习
摘要:一、pig: pig提供了一个基于Hadoop的并行地执行数据流处理的引擎。它包含了一种脚本语言,称为Pig Latin。(类似SQL) 二、pig本地安装(仅用于本地小代码测试): 下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/pig/pig-0 阅读全文

posted @ 2019-05-27 18:21 吱吱了了 阅读(1709) 评论(0) 推荐(0) 编辑

Attention-based Model
摘要:一、Attention与其他模型 1、LSTM、RNN的缺点:输入的Memory长度不能太长,否则参数会很多。 采用attention可以输入长Memory,参数不会变多。 2、Sequence to Sequence Learning : 输入和输出的句子长度可以不一样,常用来做句子翻译。 比如: 阅读全文

posted @ 2019-05-27 00:40 吱吱了了 阅读(1348) 评论(0) 推荐(0) 编辑

kesci---2019大数据挑战赛预选赛---情感分析
摘要:一、预选赛题 文本情感分类模型 本预选赛要求选手建立文本情感分类模型,选手用训练好的模型对测试集中的文本情感进行预测,判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测,达到或超过规定的分数线即通过预选赛。 二、比赛数据 训练集数据:(6 阅读全文

posted @ 2019-05-26 19:08 吱吱了了 阅读(1948) 评论(1) 推荐(0) 编辑

计算广告(1)---广告技术概览
摘要:一、个性化系统 个性化系统:推荐系统、计算广告系统、个人征信系统等。 构成四大主体: 在线投放引擎(用于实时响应请求,完成决策) 分布式计算平台(用于离线数据处理) 流计算平台(用于在线实时反馈) 数据高速公路(连接以上三部分) 二、计算广告系统框架 1、 广告投放引擎 广告系统的投放引擎采用类搜索 阅读全文

posted @ 2019-05-23 20:10 吱吱了了 阅读(1256) 评论(0) 推荐(0) 编辑

转载:python合并多个txt文件成为一个文件(简单python学习)
摘要:#coding=utf-8 import os import os.path #文件夹遍历函数 #获取目标文件夹的路径 filedir = './data/click_data' #获取当前文件夹中的文件名称列表 filenames=os.listdir(filedir) #打开当前目录下的resu 阅读全文

posted @ 2019-05-22 16:13 吱吱了了 阅读(8225) 评论(2) 推荐(1) 编辑

Hadoop 使用小命令(2)
摘要:一、查看一堆文件共有多少行 查看file1/file2目录下所有文件总共多少行 hadoop fs -text file1/file2/* | wc -l 二、正则表达式 hadoop fs -text file1/file2/* | grep ',' 匹配file1/file2/*文件中含逗号', 阅读全文

posted @ 2019-05-22 16:01 吱吱了了 阅读(2373) 评论(0) 推荐(0) 编辑

shell学习(2)----常用语法
摘要:一、for、if条件: https://blog.51cto.com/qiufengsong/1252889 1、for循环: for i in $(seq 1 10);do echo $i done ###第一行:seq是指1到10,第二行:echo是打印的意思,打印1到10 2、if条件: 案例 阅读全文

posted @ 2019-05-22 14:00 吱吱了了 阅读(641) 评论(0) 推荐(0) 编辑

docker入门
摘要:一、安装 https://www.runoob.com/docker/windows-docker-install.html win7、win8 系统、win10家庭版 win7、win8 等需要利用 docker toolbox 来安装,国内可以使用阿里云的镜像来下载,下载地址:http://mi 阅读全文

posted @ 2019-05-18 23:06 吱吱了了 阅读(334) 评论(0) 推荐(0) 编辑

hadoop fs 常用命令(1)
摘要:Hadoop: https://blog.csdn.net/mulangren1988/article/details/54860924Hadoop:1. Hadoop fs –fs [local | <file system URI>]: 列出在指定目录下的文件内容,支持pattern匹配。输出格 阅读全文

posted @ 2019-05-17 09:55 吱吱了了 阅读(4110) 评论(0) 推荐(0) 编辑

图的BFS
摘要:目录: 一、算法的基本思路 二、算法过程 三、题目:785判断是否为二分图 https://blog.csdn.net/weixin_40953222/article/details/80544928 一、算法的基本思路 广度优先搜索类似于树的层次遍历过程。 它需要借助一个队列来实现。如图2-1-1 阅读全文

posted @ 2019-05-06 10:02 吱吱了了 阅读(356) 评论(0) 推荐(0) 编辑

图的遍历---DFS
摘要:类型一:邻接表 题目一: "员工的重要性" 题目描述 给定一个保存员工信息的数据结构,它包含了员工 唯一的id , 重要度 和 直系下属的id 。 比如,员工1是员工2的领导,员工2是员工3的领导。他们相应的重要度为15, 10, 5。那么员工1的数据结构是[1, 15, [2]],员工2的数据结构 阅读全文

posted @ 2019-05-06 08:53 吱吱了了 阅读(564) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示