信息学奥赛一本通 1400:统计单词数 | 1954:【11NOIP普及组】统计单词数 | OpenJudge NOI 1.12 05 | 洛谷 P1308 [NOIP2011 普及组] 统计单词数

本文介绍了一种统计文章中特定单词出现次数及首次出现位置的方法。通过两种方式实现:一是利用双指针逐字符对比;二是截取单词进行比较。并提供了完整的C++示例代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【题目链接】

ybt 1400:统计单词数
ybt 1954:【11NOIP普及组】统计单词数
OpenJudge NOI 1.12 05:统计单词数
洛谷 P1308 [NOIP2011 普及组] 统计单词数

【题目考点】

1. 字符串
2. 计数

【解题思路】

读入整篇文章到一个字符数组(或string类对象),读入要查找的单词。
写一个字符串大写转小写的函数,先将二者先都处理为小写字母
遍历保存整篇文章的字符数组,如果找到一个和要查找的单词相同的单词,则记录第一次出现的位置,同时计数要查找的单词出现过几次。
具体匹配方法有以下两种:

解法1:双指针比对单词

指针即为字符数组的下标变量。一个指针指向表示文章的字符串,一个指向要查找的单词。如果两指针指向的字符相同,则比对后一个字符。如果不同,则该单词比对失败。等遍历到下一个单词时再做比对。

解法2:截取单词而后比对

遍历过程中,每看到一个空格,就截取出一个单词,比对这个截取出的单词和要查找的单词。

解法3:将单词左右加上空格后,进行子串查找

string类有可以进行查找子串的成员函数
string s;
unsigned long long p = s.find(string str, int stpos)
从字符串s下标stpos开始查找子串str出现的位置。
如果s中存在子串str,则返回第一个找到的子串str在字符串s中的下标。
如果s中不存在子串str,返回-1,返回值类型为unsigned long long。
可以将原字符串s以及待查找的字符串w两端都加上空格
fp为子串w第一次出现的位置,初值为-1。
p位置一开始设为0,不断在字符串s中从p位置开始查找子串w出现的位置

  • 如果存在子串w,子串w第一个字符在s中的位置为p,记录子串w第一次次出现的位置fp为p,并进行子串计数,cnt增加1。
  • 而后从子串出现的位置p的下一个位置p+1开始继续查找子串w,如果找到则计数,cng增加1。
  • 最后看fp是否为-1。如果为-1,则输出-1。否则输出w出现的次数cnt,以及fp。

【题解代码】

(解法1使用是字符数组,解法2使用了string类,实际上无所谓使用字符数组还是string类。主要看不同的处理逻辑。)

解法1:双指针比对单词
#include<bits/stdc++.h>
using namespace std;
#define N 1000005
char s[N];//整篇文章 
void lower(char s[], int len)//将长为len的字符数组中大写字母转为小写字母 
{
	for(int i = 0; i < len; ++i)
		if(s[i] >= 'A' && s[i] <= 'Z')
			s[i] = s[i] - 'A' + 'a';
}
int main()
{
	char word[100];//word:要查找的单词 
	int k = 0, firstPos = -1, ct = 0;//k为word的下标,若当前遍历的单词已经与word不同,那么将k设为-1 
	cin >> word;
	cin.get();//吸收一个换行符 
	cin.getline(s, N);
	int len = strlen(s), lenw = strlen(word);
	lower(word, lenw);//把输入的单词及句子都转为小写 
	lower(s, len);
	for(int i = 0; i <= len; ++i)//遍历到'\0' 
	{
		if(s[i] == ' ' || s[i] == '\0')//如果完成读取一个单词 
		{
			if(k == lenw)//如果在s中遍历的长度与单词word的长度相同,即找到一个和word相同的单词 
			{
				ct++;//技术 
				if(firstPos == -1)//记录第一次出现的位置 
					firstPos = i - lenw;//当前位置i是单词后的空格的位置,减去lenw后即为单词第一个字符的位置 
			}
			k = 0;//k还原为0,准备看下一个单词是否与word相同 
		}
		else
		{
			if(k >= 0)//如果k>=0,说明s中有部分与word相同。如果k为-1,说明这个单词与word不同。 
			{
				if(word[k] == s[i])
					k++;
				else
					k = -1;
			}
		}
	}
	if(firstPos == -1)//如果不存在要查找的单词 
		cout << -1;
	else//如果存在 
		cout << ct << ' ' << firstPos;
    return 0;
}
解法2:截取单词而后比对
#include<bits/stdc++.h>
using namespace std;
string s_a, s_w, s_t;//s_a:整篇文章 s_w:要查找的单词 s_t:临时截取出的单词 
string lower(string s)//将s转中大写为小写 
{
	for(int i = 0; i < s.length(); ++i)
		if(s[i] >= 'A' && s[i] <= 'Z')
			s[i] += 32;
	return s;
} 
int main()
{
	int k = 0, firstPos = -1, ct = 0, b;//b:单词起始位置 
	cin >> s_w;
	cin.get();//吸收一个换行符 
	getline(cin, s_a);//读入整篇文章到arti 
	s_w = lower(s_w);//把输入的单词及文章都转为小写 
	s_a = lower(s_a);
	b = 0;
	for(int i = 0; i <= s_a.length(); ++i)//遍历到'\0' 
	{
		if(s_a[i] == ' ' || s_a[i] == '\0')//如果完成读取一个单词 
		{
			s_t = s_a.substr(b, i - b);//从b开始,截取出长为i-b的字符串 
			if(s_t == s_w)//如果截取出的字符串与要查找的字符串相同 
			{
				if(firstPos == -1)
					firstPos = b;
				ct++;
			}
			b = i + 1;//空格下一个位置为下一个单词的起始位置 
		}
	}
	if(firstPos == -1)//如果不存在要查找的单词 
		cout << -1;
	else//如果存在 
		cout << ct << ' ' << firstPos;
    return 0;
}
解法3:将单词左右加上空格后,进行子串查找
#include<bits/stdc++.h>
using namespace std;
string lower(string s)
{
	for(int i = 0; i < s.length(); ++i)
		s[i] = tolower(s[i]);
	return s;
}
int main()
{
	string s, w;
	getline(cin, w);
	getline(cin, s);	
	s = ' '+lower(s)+' ';
	w = ' '+lower(w)+' ';
	int fp = -1, p = s.find(w), cnt = 0;
	while(p != -1)
	{
		if(fp == -1)
			fp = p;
		cnt++;
		p = s.find(w, p+1);
	}
	if(fp == -1)
		cout << -1;
	else
		cout << cnt << ' ' << fp;
	return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值