广告:宝塔Linux面板高效运维的服务器管理软件 点击【 https://www.bt.cn/p/uNLv1L 】立即购买
本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于字符串的相关知识,其中主要介绍了常用的基础方法以及特殊字符、emoji内部表示方式等内容,下面一起来看一下,希望对大家有帮助。
【相关推荐:javascript视频教程、web前端】
不论在何种编程语言中,字符串都是重要的数据类型,跟随我了解更多JavaScript
字符串知识吧!
字符串就是由字符组成的串,如果学习过C
、Java
就应该知道,字符本身也可以独立成为一个类型。但是,JavaScript
没有单个的字符类型,只有长度为1
的字符串。
JavaScript
的字符串采用固定的UTF-16
编码,不论我们编写程序时采用何种编码,都不会影响。
字符串有三种写法:单引号、双引号、反引号。
let single = 'abcdefg';//单引号let double = "asdfghj";//双引号let backti = `zxcvbnm`;//反引号登录后复制
单、双引号具有相同的地位,我们不做区分。
字符串格式化
反引号允许我们使用${...}
优雅的格式化字符串,取代使用字符串加运算。
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);登录后复制
代码执行结果:
多行字符串
反引号还可以允许字符串跨行,当我们编写多行字符串的时候非常有用。
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);登录后复制
代码执行结果:
是不是看起来觉得也没有什么?但是使用单双引号是不能实现的,如果想要得到同样的结果可以这么写:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);登录后复制
以上代码包含了一个特殊字符\n
,它是我们编程过程中最常见的特殊字符了。
字符\n
又名"换行符",支持单双引号输出多行字符串。当引擎输出字符串时,若遇到\n
,就会另换一行继续输出,从而实现多行字符串。
虽然\n
看起来是两个字符,但是只占用一个字符位置,这是因为\
在字符串中是转义符,被转义符修饰的字符就变成了特殊字符。
特殊字符列表
\n
换行符,用于新起一行输出文字。\r
回车符,将光标移到行首,在Windows
系统中使用\r\n
表示一个换行,意思是光标需要先到行首,然后再到下一行才可以换一个新的行。其他系统直接使用\n
就可以了。\'
\"
单双引号,主要是因为单双引号是特殊字符,我们想在字符串中使用单双字符就要转义。\\
反斜杠,同样因为\
是特殊字符,如果我们就是想输出\
本身,就要对其转义。\b
\f
\v
退格、换页、垂直标签——已经不再使用。\xXX
编码为XX
的十六进制Unicode
字符,例如:\x7A
表示z
(z
的十六进制Unicode
编码为7A
)。\uXXXX
编码为XXXX
的十六进制Unicode
字符,例如:\u00A9
表示 © 。\u{X...X}
(1-6
个十六进制字符)UTF-32
编码为X...X
的Unicode
符号。举个例子:
console.log('I\'m a student.');// \'console.log("\"I love U\"");// \"console.log("\\n is new line character.");// \nconsole.log('\u00A9')// ©console.log('\u{1F60D}');//登录后复制
代码执行结果:
有了转义符\
的存在,理论上我们可以输出任何字符,只要找到它对应的编码就可以了。
避免使用\'
、\"
对于字符串中的单双引号,我们可以通过在单引号中使用双引号、在双引号中使用单引号,或者直接在反引号中使用单双引号,就可以巧妙的避免使用转义符,例如:
console.log("I'm a student.");//双引号中使用单引号console.log('"" is used.');//单引号中使用双引号console.log(`' " is used.`);//反引号中使用单双引号登录后复制
代码执行结果如下:
.length通过字符串的.length
属性,我们可以获得字符串的长度:
console.log("HelloWorld\n".length);//11登录后复制
这里\n
只占用了一个字符。
访问字符、charAt()、for…of《基础类型的方法》章节我们探究了
JavaScript
中的基础类型为什么会有属性和方法,你还记得吗?
字符串是字符组成的串,我们可以通过[字符下标]
访问单个的字符,字符下标从0
开始:
let str = "The author is handsome.";console.log(str[0]);//Tconsole.log(str[4]);//aconsole.log(str[str.length-1]);//.登录后复制
代码执行结果:
我们还可以使用charAt(post)
函数获得字符:
let str = "The author is handsome.";console.log(str.charAt(0));//Tconsole.log(str.charAt(4));//aconsole.log(str.charAt(str.length-1));//.登录后复制
二者执行效果完全相同,唯一的区别在于越界访问字符时:
let str = "01234";console.log(str[9]);//undefinedconsole.log(str.charAt(9));//""(空串)登录后复制
我们还可以使用for ..of
遍历字符串:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);0登录后复制字符串不可变
JavaScript
中的字符串一经定义就不可更改,举个例子:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);1登录后复制
代码执行结果:
如果想获得一个不一样的字符串,只能新建:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);2登录后复制
看起来我们似乎改变了字符串,实际上原来的字符串并没有被改变,我们得到的是replace
方法返回的新字符串。
转换字符串大小写,或者转换字符串中单个字符的大小写。
这两个字符串的方法比较简单,举例带过:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);3登录后复制
代码执行结果:
.indexOf()、.lastIndexOf() 查找子串.indexOf(substr,idx)
函数从字符串的idx
位置开始,查找子串substr
的位置,成功返回子串首字符下标,失败返回-1
。
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);4登录后复制
代码执行结果:
如果我们想查询字符串中所有子串位置,可以使用循环:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);5登录后复制
代码执行结果如下:
.lastIndexOf(substr,idx)
倒着查询子串,首先查找最后一个符合的串:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);6登录后复制按位取反技巧(不推荐,但要会)
由于indexOf()
和lastIndexOf()
方法在查询不成功的时候会返回-1
,而~-1 === 0
。也就是说只有在查询结果不为-1
的情况下使用~
才为真,所以我们可以:
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);7登录后复制
通常情况下,我们不推荐在不能明显体现语法特性的地方使用一个语法,这会在可读性上产生影响。好在以上代码只出现在旧版本的代码中,这里提到就是为了大家在阅读旧代码的时候不会产生困惑。
.includes()、.startsWith()、.endsWith()补充:
~
是按位取反运算符,例如:十进制的数字2
的二进制形式为0010
,~2
的二进制形式就是1101
(补码),也就是-3
。简单的理解方式,
~n
等价于-(n+1)
,例如:~2 === -(2+1) === -3
.includes(substr,idx)
用于判断substr
是否在字符串中,idx
是查询开始的位置
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);8登录后复制
代码执行结果:
.startsWith('substr')
和.endsWith('substr')
分别判断字符串是否以substr
开始或结束
let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);9登录后复制
代码执行结果:
.substr()、.substring()、.slice().substr()
、.substring()
、.slice()
均用于取字符串的子串,不过用法各有不同。
.substr(start,len)
返回字符串从start
开始len
个字符组成的字符串,如果省略len
,就截取到原字符串的末尾。start
可以为负数,表示从后往前第start
个字符。
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);0登录后复制
代码执行结果:
.slice(start,end)
返回字符串从start
开始到end
结束(不包括)的字符串。start
和end
可以为负数,表示倒数第start/end
个字符。
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);1登录后复制
代码执行结果:
.substring(start,end)
作用几乎和.slice()
相同,差别在两个地方:
end > start
;不允许负数,负数视为0
;举例:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);2登录后复制
代码执行结果:
对比三者的区别:
.slice(start,end)
[start,end)
可负.substring(start,end)
[start,end)
负值为0
.substr(start,len)
从start
开始长为len
的子串可负.codePointAt()、String.fromCodePoint()方法多了自然就选择困难了,这里建议记住
.slice()
就可以了,相比于其他两种更灵活。
我们在前文中已经提及过字符串的比较,字符串按照字典序进行排序,每个字符背后都是一个编码,ASCII
编码就是一个重要的参考。
例如:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);3登录后复制
字符之间的比较,本质上是代表字符的编码之间的比较。JavaScript
使用UTF-16
编码字符串,每个字符都是一个16
为的代码,想要知道比较的本质,就需要使用.codePointAt(idx)
获得字符的编码:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);4登录后复制
代码执行结果:
使用String.fromCodePoint(code)
可以把编码转为字符:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);5登录后复制
代码执行结果如下:
这个过程可以用转义符\u
实现,如下:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);6登录后复制
下面我们探索一下编码为[65,220]
区间的字符:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);7登录后复制
代码执行部分结果如下:
上图并没有展示所有的结果,快去试试吧。
.localeCompare()基于国际化标准ECMA-402
,JavaScript
已经实现了一个特殊的方法(.localeCompare()
)比较各种字符串,采用str1.localeCompare(str2)
的方式:
str1 < str2
,返回负数;如果str1 > str2
,返回正数;如果str1 == str2
,返回0;举个例子:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);8登录后复制
为什么不直接使用比较运算符呢?
这是因为英文字符有一些特殊的写法,例如,á
是a
的变体:
let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);9登录后复制
虽然也是a
,但是比z
还要大!!
此时就需要使用.localeCompare()
方法:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);0登录后复制常用方法
str.trim()
去除字符串前后空白字符,str.trimStart()
、str.trimEnd()
删除开头、结尾的空格;
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);1登录后复制
str.repeat(n)
重复n
次字符串;
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);2登录后复制
str.replace(substr,newstr)
替换第一个子串,str.replaceAll()
用于替换所有子串;
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);3登录后复制
还有很多其他方法,我们可以访问手册获取更多知识。
进阶内容生僻字、emoji、特殊符号JavaScript
使用UTF-16
编码字符串,也就是使用两个字节(16
位)表示一个字符,但是16
位数据只能表示65536
个字符,对于常见字符自然不在话下,但是对于生僻字(中文的)、emoji
、罕见数学符号等就力不从心了。
这种时候就需要扩展,使用更长的位数(32
位)表示特殊字符,例如:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);4登录后复制
代码执行结果:
这么做的结果是,我们无法使用常规的方法处理它们,如果我们单个输出其中的每个字节,会发生什么呢?
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);5登录后复制
代码执行结果:
可以看到,单个输出字节是不能识别的。
好在String.fromCodePoint()
和.codePointAt()
两个方法是可以处理这种情况的,这是因为二者是最近才加入的。在旧版本的JavaScript
中,只能使用String.fromCharCode()
和.charCodeAt()
两个方法转换编码和字符,但是他们不适用于特殊字符的情况。
我们可以通过判断一个字符的编码范围,判断它是否是一个特殊字符,从而处理特殊字符。如果一个字符的代码在0xd800~0xdbff
之间,那么他是32
位字符的第一部分,它的第二部分应该在0xdc00~0xdfff
。
举个例子:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);6登录后复制
代码执行结果:
规范化在英文中,存在很多基于字母的变体,例如:字母 a
可以是 àáâäãåā
的基本字符。这些变体符号并没有全部存储在UTF-16
编码中,因为变化组合太多了。
为了支持所有的变体组合,同样使用多个Unicode
字符表示单个变体字符,在编程过程中,我们可以使用基本字符加上“装饰符号”的方式表达特殊字符:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);7登录后复制
代码执行结果:
一个基础字母还可以有多个装饰,例如:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);8登录后复制
代码执行结果:
这里存在一个问题,在多个装饰的情况下,装饰的排序不同,实际上展示的字符是一样的。
如果我们直接比较这两种表示形式,却会得到错误的结果:
let ques = 'Is the author handsome?\nA. Very handsome;\nB. So handsome;\nC. Super handsome;';console.log(ques);9登录后复制
代码执行结果:
为了解决这种情况,有一个**Unicode
规范化算法,可以将字符串转为通用**格式,由str.normalize()
实现:
console.log('I\'m a student.');// \'console.log("\"I love U\"");// \"console.log("\\n is new line character.");// \nconsole.log('\u00A9')// ©console.log('\u{1F60D}');//0登录后复制
代码执行结果:
【相关推荐:javascript视频教程、web前端】
以上就是JavaScript字符串常见基础方法精讲的详细内容,更多请关注9543建站博客其它相关文章!
发表评论