【题目链接】
ybt 1400:统计单词数
ybt 1954:【11NOIP普及组】统计单词数
OpenJudge NOI 1.12 05:统计单词数
洛谷 P1308 [NOIP2011 普及组] 统计单词数
【题目考点】
1. 字符串
2. 计数
【解题思路】
读入整篇文章到一个字符数组(或string类对象),读入要查找的单词。
写一个字符串大写转小写的函数,先将二者先都处理为小写字母
遍历保存整篇文章的字符数组,如果找到一个和要查找的单词相同的单词,则记录第一次出现的位置,同时计数要查找的单词出现过几次。
具体匹配方法有以下两种:
解法1:双指针比对单词
指针即为字符数组的下标变量。一个指针指向表示文章的字符串,一个指向要查找的单词。如果两指针指向的字符相同,则比对后一个字符。如果不同,则该单词比对失败。等遍历到下一个单词时再做比对。
解法2:截取单词而后比对
遍历过程中,每看到一个空格,就截取出一个单词,比对这个截取出的单词和要查找的单词。
解法3:将单词左右加上空格后,进行子串查找
string类有可以进行查找子串的成员函数
string s;
unsigned long long p = s.find(string str, int stpos)
从字符串s下标stpos开始查找子串str出现的位置。
如果s中存在子串str,则返回第一个找到的子串str在字符串s中的下标。
如果s中不存在子串str,返回-1,返回值类型为unsigned long long。
可以将原字符串s以及待查找的字符串w两端都加上空格
fp为子串w第一次出现的位置,初值为-1。
p位置一开始设为0,不断在字符串s中从p位置开始查找子串w出现的位置
- 如果存在子串w,子串w第一个字符在s中的位置为p,记录子串w第一次次出现的位置fp为p,并进行子串计数,cnt增加1。
- 而后从子串出现的位置p的下一个位置p+1开始继续查找子串w,如果找到则计数,cng增加1。
- 最后看fp是否为-1。如果为-1,则输出-1。否则输出w出现的次数cnt,以及fp。
【题解代码】
(解法1使用是字符数组,解法2使用了string类,实际上无所谓使用字符数组还是string类。主要看不同的处理逻辑。)
解法1:双指针比对单词
#include<bits/stdc++.h>
using namespace std;
#define N 1000005
char s[N];//整篇文章
void lower(char s[], int len)//将长为len的字符数组中大写字母转为小写字母
{
for(int i = 0; i < len; ++i)
if(s[i] >= 'A' && s[i] <= 'Z')
s[i] = s[i] - 'A' + 'a';
}
int main()
{
char word[100];//word:要查找的单词
int k = 0, firstPos = -1, ct = 0;//k为word的下标,若当前遍历的单词已经与word不同,那么将k设为-1
cin >> word;
cin.get();//吸收一个换行符
cin.getline(s, N);
int len = strlen(s), lenw = strlen(word);
lower(word, lenw);//把输入的单词及句子都转为小写
lower(s, len);
for(int i = 0; i <= len; ++i)//遍历到'\0'
{
if(s[i] == ' ' || s[i] == '\0')//如果完成读取一个单词
{
if(k == lenw)//如果在s中遍历的长度与单词word的长度相同,即找到一个和word相同的单词
{
ct++;//技术
if(firstPos == -1)//记录第一次出现的位置
firstPos = i - lenw;//当前位置i是单词后的空格的位置,减去lenw后即为单词第一个字符的位置
}
k = 0;//k还原为0,准备看下一个单词是否与word相同
}
else
{
if(k >= 0)//如果k>=0,说明s中有部分与word相同。如果k为-1,说明这个单词与word不同。
{
if(word[k] == s[i])
k++;
else
k = -1;
}
}
}
if(firstPos == -1)//如果不存在要查找的单词
cout << -1;
else//如果存在
cout << ct << ' ' << firstPos;
return 0;
}
解法2:截取单词而后比对
#include<bits/stdc++.h>
using namespace std;
string s_a, s_w, s_t;//s_a:整篇文章 s_w:要查找的单词 s_t:临时截取出的单词
string lower(string s)//将s转中大写为小写
{
for(int i = 0; i < s.length(); ++i)
if(s[i] >= 'A' && s[i] <= 'Z')
s[i] += 32;
return s;
}
int main()
{
int k = 0, firstPos = -1, ct = 0, b;//b:单词起始位置
cin >> s_w;
cin.get();//吸收一个换行符
getline(cin, s_a);//读入整篇文章到arti
s_w = lower(s_w);//把输入的单词及文章都转为小写
s_a = lower(s_a);
b = 0;
for(int i = 0; i <= s_a.length(); ++i)//遍历到'\0'
{
if(s_a[i] == ' ' || s_a[i] == '\0')//如果完成读取一个单词
{
s_t = s_a.substr(b, i - b);//从b开始,截取出长为i-b的字符串
if(s_t == s_w)//如果截取出的字符串与要查找的字符串相同
{
if(firstPos == -1)
firstPos = b;
ct++;
}
b = i + 1;//空格下一个位置为下一个单词的起始位置
}
}
if(firstPos == -1)//如果不存在要查找的单词
cout << -1;
else//如果存在
cout << ct << ' ' << firstPos;
return 0;
}
解法3:将单词左右加上空格后,进行子串查找
#include<bits/stdc++.h>
using namespace std;
string lower(string s)
{
for(int i = 0; i < s.length(); ++i)
s[i] = tolower(s[i]);
return s;
}
int main()
{
string s, w;
getline(cin, w);
getline(cin, s);
s = ' '+lower(s)+' ';
w = ' '+lower(w)+' ';
int fp = -1, p = s.find(w), cnt = 0;
while(p != -1)
{
if(fp == -1)
fp = p;
cnt++;
p = s.find(w, p+1);
}
if(fp == -1)
cout << -1;
else
cout << cnt << ' ' << fp;
return 0;
}