Matlab的优势在于向量操作,字符串操作往往费时费力,但是如果能充分利用Matlab自带的一些函数,也可以取得不错的效果。下面就介绍一下字符串数组查找的小技巧。
字符串数组我通常会选择应用cell格式保存,下面的分析也是建立在这个前提下。
【1】 strcmp() 函数
strcmp() 函数的基本功能是比较两个字符串是否相等,其基本用法是:
TF = strcmp(s1,s2);
但是,如果我们要查找字符串数组中等于某字符串的索引时,该如果操作?strcmp() 函数也提供了这个功能,用法相同:
TF = strcmp(s1,s2);
其中,s1是字符串数组,s2是字符串,返回值为逻辑类型,大小与字符串数组s1相同;
【2】 strfind() 函数
strcmp() 函数比较的是两个字符串是否相等。但是如果想查找字符串数组中包含某字符串的记录时,我们就可以选择strfind() 函数。
k = strfind(str,pattern);
输出结果k表示pattern在str中出现的位置,若不出现,则返回[]。比如:
S = ‘Find the starting indices of the pattern string’; k = strfind(S, ‘in’) k = 2 15 19 45
上面是strfind() 函数的基本功能,但是如果查找字符串数组中包含某字符串的索引时,strfind() 函数也可以大显身手,返回和字符串数组相同大小的cell类型数据,每个cell为字符串出现位置,向量类型,比如:
cstr = {‘How much wood would a woodchuck’; ‘if a woodchuck could chuck wood?’}; idx = strfind(cstr, ‘wood’) idx = [1*2 double] [1*2 double] Idx{:,:} ans = 10 23 ans = 6 28
【3】 一个问题:
有一个字符串数组cstr1,要找到包含字符串str2的索引,该如果操作?
一个直接的答案是:
idx = strfind(cstr1,str2); finger(length(idx),1) = 1==0; for i = 1:length(idx) if ~isempty(idx(i)) finger(i) = 1==1; end end
思路是正确的,但是代码量有点大,需要7行,而且速度较慢。其实要实现这个功能,1行代码足矣。如下:
finger = ~cellfun(@isempty, strfind(cstr1,str2));
上面的代码还有另外一种写法,
finger = cellfun(@(x) ~isempty(strfind(x,str2)), cstr1);
三种方法输出结果是一样的,但是第2种方法速度最快,第1种方法次之,第3种方法最慢。大家可以进行测试下。