随笔分类 - Technology
摘要:有数据分析,数据挖掘,以及机器学习和深度学习实践经验的读者应该会对Jupyter Notebook这一工具十分熟悉,而JupyterLab是它的升级版本,其提供了更具扩展性,更加可定制化的功能选项。 安装与启动JupyterLab的方法与Jupyter Notebook一样简单。 应用安装 pip
阅读全文
摘要:昨天在比较完C++中std::vector的两个方法的性能差异并留下记录后—— "编程杂谈——使用emplace_back取代push_back" ,今日尝试在C 中测试对应功能的性能。 C 中对应std::vector的数据结构为List。更多的对应关系可以参照下面: std::vector Li
阅读全文
摘要:近日在YouTube视频上看到关于vector中emplace_back与push_back区别的介绍,深感自己在现代C++中还是有不少遗漏的知识点,遂写了段代码,尝试比较两者的差别。 示例代码 运行结果 结论 emplace_back方法可以不调用拷贝构造函数,所以理论上它应该比push_back
阅读全文
摘要:最近遇到个需要在C++中处理XML文件的需求,虽然对此方面并不是很熟,但好在有GitHub上的 "awesome cpp" 项目的帮助,还是收获了足够的相关知识。 类库 常用的或被推荐的XML类库有以下数个选项,不过相较于纯C完成的类库个人还是更倾向于C++的类库: Boost.PropertyTr
阅读全文
摘要:在Visual Studio中选择.NET Framework框架并选用任意模板创建一个普通的Web应用工程,毫无疑问,此时应该是能够正常运行此工程的。 但是将工程属性 编译 Platform target一项中从Any CPU改成x64。 再运行工程后,页面会出现服务器错误的提示。 这是因为默认情
阅读全文
摘要:什么是gRPC "官方" 的定义: gRPC is a modern open source high performance RPC framework that can run in any environment. It can efficiently connect services in
阅读全文
摘要:近日,意外地遇上件不寻常的事情。在解析PDF文件,读取其中内容的时候,对某一文件的处理,始终无法达到预期的效果。 解析方法如下: 经调试发现此时传入的参数值是 ,但在实际执行时并未进入到 条件语句内。这是件怪事。 将条件值与传入值分别拷贝出来,再放到一段简单的测试代码中,会看到结果显示为False。
阅读全文
摘要:ML.NET在不久前发行了1.0版本,在考虑这一新轮子的实际用途时,最先想到的是其能否调用已有的模型,特别是最被广泛使用的Tensorflow模型。于是在查找了不少资料后,有了本篇示例。希望可以有抛砖引玉之功。 环境 Tensorflow 1.13.1 Microsoft.ML 1.0.0 Micr
阅读全文
摘要:GraphQL是什么 GraphQL既是一种用于API的查询语言也是一种通过使用对应数据的类型系统,执行数据查询的服务端运行时。GraphQL没有局限于任何数据库或存储引擎,而是通过既有代码及数据获得支持。 Schema GraphQL的Schema是GraphQL服务端实现的核心部分。它负责描述能
阅读全文
摘要:简述 OData,即Open Data Protocol,是由微软在2007年推出的一款开放协议,旨在通过简单、标准的方式创建和使用查询式及交互式RESTful API。 类库 在.NET Core中想要使用OData功能的话需要添加 包。 准备模型类 创建Edm模型 OData使用EDM,即Ent
阅读全文
摘要:Web产品中很多时候需要在客户端,即浏览器中保存一些必要的数据。而面临这类需求时,你应当知悉对应的解决方案不仅仅只有一种。 Cookie 这是最早被使用,且至今仍被广泛采用的最简单的浏览器中保存数据方法。 Cookie使用键/值形式存储数据,且数据类型只能为字符串。 Cookie相关的CRUD操作:
阅读全文
摘要:理解问题 客户细分需要解决的问题是按照客户之间的相似特征区分不同客户群体。这个问题的先决条件中没有可供使用的客户分类列表,只有客户的人物画像。 数据集 已有的数据是公司的历史商业活动记录以及客户的购买记录。 offer.csv: transaction.csv: 预处理 需要对两个数据集做关联处理,
阅读全文
摘要:理解问题 出租车的车费不仅与距离有关,还涉及乘客数量,是否使用信用卡等因素(这是的出租车是指纽约市的)。所以并不是一个简单的一元方程问题。 准备数据 建立一控制台应用程序工程,新建 文件夹,在其目录下添加 "taxi fare train.csv" 与 "taxi fare test.csv" 文件
阅读全文
摘要:在.NET生态圈中,最早被广泛使用的日志库可能是派生自Java世界里的Apache log4net。而其后来者,莫过于NLog。Nlog与log4net相比,有一项较显著的优势,它支持结构化日志。 结构化日志,也被称为语义化日志。其作用有二,利于查询与方便分析。 当系统上线被广泛使用或者时间久远之后
阅读全文
摘要:机器学习的工作流程分为以下几个步骤: 1. 理解问题 2. 准备数据 加载数据 提取特征 3. 构建与训练 训练模型 评估模型 4. 运行 使用模型 理解问题 本教程需要解决的问题是根据网站内评论的意见采取合适的行动。 可用的训练数据集中,网站评论可能是有毒(toxic)(1)或者无毒(not to
阅读全文
摘要:什么是ML.NET? ML.NET是由微软创建,为.NET开发者准备的开源机器学习框架。它是跨平台的,可以在macOS,Linux及Windows上运行。 机器学习管道 ML.NET通过管道(pipeline)方式组合机器学习过程。整个管道分为以下四个部分: Load Data 加载数据 Trans
阅读全文
摘要:最近在项目中遇到这样的需求:要将旧有系统的一部分业务逻辑集成到新的自动化流程工具中。这套正在开发的自动化工具使用的是C 语言,而旧有系统的业务逻辑则是使用AngularJS在前端构建而成。所以最初的考虑中有两个解决方案,一是将原有JavaScript代码改写成C 代码,以便集成;二是将所需代码抽离后
阅读全文
摘要:Entity Framework在.NET Core中被命名为Entity Framework Core。虽然一般会用于对SQL Server数据库进行数据操作,但其实它还支持其它数据库,这里就以PostgreSQL作为例子。 PostgreSQL PostgreSQL可以选用原生系统与Docker
阅读全文
摘要:Dapper作为.NET生态中广为人知的轻量级ORM类库在.NET Core里仍能被有效利用,并且其不但可以连通SQL Server数据库还提供对其它数据库,比如MySQL的支持。这里试验了一下通过Dapper连接MySQL的方法。 MySQL 可以选择直接安装在原生系统中或是Docker里。 "O
阅读全文
摘要:Steeltoe里的分布式追踪功能与 "Spring Cloud Sleuth" 一样,支持在日志中记录追踪数据,或者上传到远端的服务,比如Zipkin。 Logging 在Steeltoe中使用日志时需要引入其特有的日志包 。 之后还需在应用程序启动时加入日志提供器。 接下来,引入追踪包 。 然后
阅读全文