【LeetCode-274】H指数
问题
给定一位研究者论文被引用次数的数组(被引用次数是非负整数)。编写一个方法,计算出研究者的 h 指数。
h 指数的定义: “h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (N 篇论文中)至多有 h 篇论文分别被引用了至少 h 次。(其余的 N - h 篇论文每篇被引用次数不多于 h 次。)”
示例
输入: citations = [3,0,6,1,5]
输出: 3
解释: 给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。由于研究者有 3 篇论文每篇至少被引用了 3 次,其余两篇论文每篇被引用不多于 3 次,所以她的 h 指数是 3。
解答1:排序
class Solution {
public:
int hIndex(vector<int>& citations) {
sort(citations.begin(), citations.end());
int n = citations.size();
for (int i = 0; i < n; i++) {
int h = n - i;
if (h <= citations[i]) return h;
}
return 0;
}
};
重点思路
题目要求h
个元素大于等于数组中的某个值,显然是一个有序数组的特征,所以先对数组进行排序。
我们期望的h
是满足要求的前提下越大越好,所以将h
从大到小遍历,当满足要求时直接输出。这里的要求是h <= citations[i]
,直观的说法就是有h
篇论文的引用数大于等于h
这个值。
排序后,这里可以使用二分查找的方法,具体可参考【LeetCode-275】H指数 II。
解答2:桶排序
class Solution {
public:
int hIndex(vector<int>& citations) {
int h = citations.size(), sum = 0;
int bucket[h + 1]; bzero(bucket, sizeof bucket);
for (int c : citations) bucket[min(c, h)]++; //将大于论文总数量的引用次数裁剪到与论文的总数量相同
for (; h >= 0; h--) {
sum += bucket[h];
if (h <= sum) return h;
}
return 0;
}
};
重点思路
重设一个bucket数组,角标代表引用次数,值代表该引用次数的论文有几篇,并将大于论文总数量的引用次数裁剪到与论文的总数量相同,因为只要大于等于论文数量了,大多少不影响结果。随后将h值从大到小推,h最大为论文的总数量,当论文数量超过引用数量时,满足题目要求,此时直接输出该h
值即可。