机器翻译

题面

小晨的电脑上安装了一个机器翻译软件，他经常用这个软件来翻译英语文章。

这个翻译软件的原理很简单，它只是从头到尾，依次将每个英文单词用对应的中文含义来替换。

对于每个英文单词，软件会先在内存中查找这个单词的中文含义，如果内存中有，软件就会用它进行翻译；如果内存中没有，软件就会在外存中的词典内查找，查出单词的中文含义然后翻译，并将这个单词和

译义放入内存，以备后续的查找和翻译。

假设内存中有M个单元，每单元能存放一个单词和译义。

每当软件将一个新单词存入内存前，如果当前内存中已存入的单词数不超过M−1，软件会将新单词存入一个未使用的内存单元；若内存中已存入M个单词，软件会清空最早进入内存的那个单词，腾出单元来，存放新单词。

假设一篇英语文章的长度为N个单词。

给定这篇待译文章，翻译软件需要去外存查找多少次词典？

假设在翻译开始前，内存中没有任何单词。

输入格式

输入文件共2行，每行中两个数之间用一个空格隔开。

第一行为两个正整数M和N，代表内存容量和文章的长度。

第二行为N个非负整数，按照文章的顺序，每个数（大小不超过1000）代表一个英文单词。

文章中两个单词是同一个单词，当且仅当它们对应的非负整数相同。

输出格式

输出文件共1行，包含一个整数，为软件需要查词典的次数。

数据范围

$0<M≤100$
$0<N≤1000$

输入样例：

3 7
1 2 1 5 4 4 1

输出样例：

算法

(模拟，队列) $O(N)$
这道题是让我们实现一个先进先出的缓存机制。

数据的存储：

由于是先进先出，所以我们可以用循环队列来维护缓存中的所有单词，这里可以用C++STL中的queue。
用 $bool$ 数组存储每个单词是否已经在队列中，这样就可以用 $O(1)$ 的时间判断每个单词是否已在缓存中了。
从前往后依次处理文章中的每个单词，然后分情况处理：

如果 $x$ 已在缓存中，不需要做其他处理；
如果 $x$ 不在缓存中：
- 如果队列不满，将 $x$ 插入队尾；
- 如果队列已满，将队头弹出，然后将 $x$ 插入队尾；
  
  时间复杂度分析
  依次对每个单词处理一遍，每次处理时只有常数次操作，所以总时间复杂度是 $O(N)$ ，其中 $N$ 是单词个数。

代码

#include <iostream>
#include <queue>
using namespace std;
const int N = 1010;
int m, n;
bool st[N];
int main()
{
    cin >> m >> n;
    queue<int> q;
    int res = 0;
    for (int i = 0; i < n; i ++ )
    {
        int x;
        cin >> x;
        if (!st[x])
        {
            if (q.size() == m)
            {
                int t = q.front();
                st[t] = false;
                q.pop();
            }
            q.push(x);
            st[x] = true;
            res ++ ;
        }
    }
    cout << res << endl;
    return 0;
}

本文作者：邦的轩辕

本文链接：https://www.cnblogs.com/bangdexuanyuan/p/14400471.html

posted @ 2021-02-13 18:09 邦的轩辕阅读(324) 评论(0) 编辑收藏举报

刷新页面返回顶部

（评论功能已被禁用）

公告

昵称：邦的轩辕园龄：5年1个月粉丝：9 关注：48

昵称：邦的轩辕
园龄： 5年1个月
粉丝： 9
关注： 48

+加关注

想，都是问题，做，才是答案|

2025年3月

日

一

二

三

四

五

六

邦的轩辕

机器翻译

题面

输入格式

输入文件共2行，每行中两个数之间用一个空格隔开。

输出格式

数据范围

输入样例：

输出样例：

算法

数据的存储：

代码

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类

随笔档案

相册

Latex学习

PPT

好网站

阅读排行榜

推荐排行榜