每日一题(24)——统计文本中出现次数最多的K个词(Top K)

统计英文电子书中出现次数最多的K个单词。

使用map和priority_queue实现,十分简洁有效。

 

1.使用map保存每种单词的数量;

2.使用priority_queue保存最大的K个数(注意相当于小顶堆,使用">"操作符

    priority_queue,vector>,greater>> queueK

 

代码:

#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;

string filename="D:/Twilight.txt";

void topK(const int &K)
{
	double t=clock();

	ifstream infile;
	infile.open(filename);
	if (!infile)
		cout<<"can not open file"<wordcount;

	while(true)
	{
		infile>>s;
		if(infile.eof()) break;
		wordcount[s]++;
	}
	cout<<"单词种类:"<";
	priority_queue,vector>,greater>> queueK;
	for (map::iterator iter=wordcount.begin(); iter!=wordcount.end(); iter++)
	{
		queueK.push(make_pair(iter->second,iter->first));
		if(queueK.size()>K)
			queueK.pop();
	}

	pairtmp;
	while (!queueK.empty())
	{
		tmp=queueK.top();
		queueK.pop();
		cout<"<>k;
		if(k==0)break;
		topK(k);
	}
}


 

附:统计文本《Twilight

你可能感兴趣的:(算法,贪心,C++)