06 2022 档案

摘要:**导读:**在公司内部,业务线经常面临数据有哪些、质量如何、是否可用、能产生多大价值的困惑,并且,随着数据量的增加,计算和存储资源面临瓶颈。本次将围绕数据治理重点关注的计算、存储等方面,分享数据治理的产品实践。通过分享,一方面可以了解当前业务线主要面临的待治理的数据问题;另一方面,从计算、存储等主 阅读全文
posted @ 2022-06-20 15:05 DataFunTalk 阅读(362) 评论(0) 推荐(0) 编辑
摘要:分享嘉宾:叶聪 腾讯 技术专家 编辑整理:张智跃 内容来源:DataFun AI Talk「智能技术前沿实践分享」 出品社区:DataFun 导读: 本次分享系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。主要包括以下六个部分: 1、朋友圈爆款活动背后 阅读全文
posted @ 2022-06-19 13:07 DataFunTalk 阅读(584) 评论(0) 推荐(1) 编辑
摘要:导读: 本文主要介绍了快手的精排模型实践,包括快手的推荐系统,以及结合快手业务展开的各种模型实战和探索,全文围绕以下几大方面展开: 快手推荐系统 CTR模型——PPNet 多domain多任务学习框架 短期行为序列建模 长期行为序列建模 千亿特征,万亿参数模型 总结和展望 -- 01 快手推荐系统 阅读全文
posted @ 2022-06-18 18:52 DataFunTalk 阅读(923) 评论(0) 推荐(0) 编辑
摘要:分享嘉宾:张政 京东 算法工程师 编辑整理:AMS 周金星 出品平台:DataFunTalk 导读: 内容生态建设是近几年互联网快速发展的关键动因,也是AI化的重点方向之一。本文主要分享在京东广告业务下内容理解体系的建设情况,从标签化、内容准入、质量美学评价等多个角度探讨内容理解能力的应用;同时整体 阅读全文
posted @ 2022-06-17 18:40 DataFunTalk 阅读(1151) 评论(0) 推荐(1) 编辑
摘要:导读: 本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括: 什么是湖仓一体架构 哔哩哔哩目前的湖仓一体架构 湖仓一体架构下,数据的排序组织优化 湖仓一体架构下,索引增强与优化的实践探索 -- 01 什么是湖仓一体 当我们讲湖仓一体时,涉及到数据湖和数 阅读全文
posted @ 2022-06-15 11:59 DataFunTalk 阅读(927) 评论(0) 推荐(6) 编辑
摘要:导读: 首先简单介绍一下网易杭州研究院情况简介,如下图所示: 我们公司主要从事平台技术开发和建设方面,工作的重点方向主要在解决用户在数据治理中的各种问题,让用户能更高效地管理自己的数据,进而产生更大的价值,比如如何整合现有功能流程,节省用户使用成本;增加新平台不断调研,丰富平台功能;新平台功能、性能 阅读全文
posted @ 2022-06-14 14:16 DataFunTalk 阅读(673) 评论(0) 推荐(1) 编辑
摘要:导读: 作为一种基础的数据结构,图数据的应用场景无处不在,如社交、风控、搜广推、生物信息学中的蛋白质分析等。如何高效地对海量的图数据进行存储、查询、计算及分析,是当前业界热门的方向。本文将介绍字节跳动自研的图数据库ByteGraph及其在字节内部的应用和挑战。 本文将围绕以下五点展开: 了解图数据库 阅读全文
posted @ 2022-06-13 11:49 DataFunTalk 阅读(1447) 评论(0) 推荐(0) 编辑
摘要:**导读:**本文是OPPO商业数据研发负责人&技术专家邱盛昌老师带来的“OPPO商业化数据体系建设实践”的分享。整体内容围绕着下图中垂直划分的六个部分展开,分别为:数据平台、数据接入、数据开发、数据治理、数据应用和数据分析,这个图也概括了典型的数据体系的所有内容。 -- 01 数据平台 数据平台由 阅读全文
posted @ 2022-06-12 15:08 DataFunTalk 阅读(227) 评论(0) 推荐(0) 编辑
摘要:分享嘉宾:罗景 58同城 高级架构师 编辑整理:洪鹏飞 内容来源:DataFun AI Talk《连接效率优化实践》 出品社区:DataFun **导读:**本次分享由以下几个部分构成—— 58的业务背景 综合排序框架 效率优化框架 基础数据流程(数据) 策略优化路径(算法) 效率优化平台(工程) 阅读全文
posted @ 2022-06-11 12:05 DataFunTalk 阅读(442) 评论(0) 推荐(1) 编辑
摘要:导读: 大家好,今天主要分享数据分析平台的平台演进以及我们在上面沉淀的一些数据分析方法是如何应用的。 具体分以下四部分: Part1:主要介绍下我所在的部门,数据平台部主要是做什么的,大概涉及到哪些业务,在整个数据流程当中数据平台部负责哪些东西; Part2:既然我们讲数据分析平台,那么数据分析是什 阅读全文
posted @ 2022-06-10 11:49 DataFunTalk 阅读(824) 评论(0) 推荐(0) 编辑
摘要:导读: 验证码作为网络安全的第一道屏障,其重要程度不言而喻。当前,卷积神经网络的高速发展使得许多验证码的安全性大大降低,一些新型验证码甚至选择牺牲可用性从而保证安全性。针对对抗样本技术的研究,给验证码领域带来了新的契机,并已应用于验证码反识别当中,为这场旷日持久攻防对抗注入了新的活力。 分享内容包括 阅读全文
posted @ 2022-06-09 12:04 DataFunTalk 阅读(747) 评论(0) 推荐(0) 编辑
摘要:01 背景和问题 目前,模型开发的流程越来越规范化,通常可以分为业务分析、样本准备、特征工程、模型构建、模型评估及监控这几个步骤。其中,特征工程和模型构建在建模的整个流程中依然非常耗时,并且非常依赖于模型开发者对业务的理解及数据处理的能力。 在目前实际业务场景下,面临的最大的一个问题是,如何快速地构 阅读全文
posted @ 2022-06-08 13:24 DataFunTalk 阅读(336) 评论(0) 推荐(0) 编辑