洛谷题单指南-集合-P3879 [TJOI2010] 阅读理解

原题链接:https://www.luogu.com.cn/problem/P3879

题意解读:此题本质上是计算倒排索引,所谓倒排索引,即不是通过文章来找单词,而是通过单词来找文章。

解题思路:

要建立单词和文章之间的关系,一个单词对应多篇文章,且要按照文章编号排序,编号还要去重,可以使用如下数据结构:

map<string, set<int>> h;

只需要遍历每一篇文章,对每一篇文章遍历每一个单词,将单词w对应的文章号i存入h[w].insert(i)即可建立倒排索引。

100分代码:

#include <bits/stdc++.h>
using namespace std;

map<string, set<int>> h;
int n, l, m;
string w;

int main()
{
    cin >> n;
    for(int i = 1; i <= n; i++)
    {
        cin >> l;
        while(l--)
        {
            cin >> w;
            h[w].insert(i); //将w单词对应的文章号i存入h[w]这个set<int>中
        }
    }

    cin >> m;
    while(m--)
    {
        cin >> w;
        for(auto i : h[w]) cout << i << " "; //查找单词w对应的文章号并输出
        cout << endl;
    }
    
    return 0;
}

 

posted @ 2024-03-26 16:34  五月江城  阅读(25)  评论(0编辑  收藏  举报