2012年12月26日

摘要: 在线广告的核心计算问题定义:设$\mathcal{A}$为广告集合,有$T$次浏览行为, $c_{i}$为第$i$次浏览的上下文, $u_{i}$为用户特征, $a_{i}\in\mathcal{A}$为给第$i$次浏览投放的广告. 广告中的计算问题是寻求一组广告展示$a_{1},a_{2},\cdots,a_{T}$, 使得ROI之和最大, 即求\[\{a_{1},\cdots, a_{T}\}^{*}=\underset{a_{1},\cdots,a_{T}\in\mathcal{A}}{\arg\max}\sum_{i=1}^{T}ROI(a_{i},u_{i},c_{i})\]上式中, 阅读全文
posted @ 2012-12-26 23:44 rongyilin 阅读(233) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*-# 下载网页import urllib2def get_page(url): try: print "Downloading: %s" % url fp = urllib2.urlopen(url) except: print "Failed!" return None return fp 阅读全文
posted @ 2012-12-26 14:34 rongyilin 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 1 # -*- coding: utf-8 -*- 2 # 将字符串按照段落分开, 这里认为段落与段落之间间隔一个空行(类似Latex) 3 # 用itertools.groupby() 函数, 列表中具有相同key的函数会被group到一起 4 s = 'aaaaaaaaaa\n \nbbbbbbbbb\nccccccccc' 5 lines = s.split('\n') 6 print lines 7 8 from itertools import groupby 9 def paragraphs(lines, is_seperator=lambda s: 阅读全文
posted @ 2012-12-26 01:26 rongyilin 阅读(282) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*-# [1] Python Cookbook 5.7 增加元素时候保持序列顺序# [2] http://s99f.blog.163.com/blog/static/351183652010111602517298/import heapqimport randomrand = random.sample(range(10), 10) # 生成随机整数列表print rand# >>> [7, 4, 1, 3, 8, 5, 9, 0, 2, 6]heap = []for x in rand: heapq.heappush(heap, 阅读全文
posted @ 2012-12-26 00:31 rongyilin 阅读(249) 评论(0) 推荐(0) 编辑

导航