首页
笔记
项目
软件下载
归档
友情链接
留言板
1
最好的“添加到我的小程序提示”组件(pin-prompt)
2
摸鱼阅读多端同步版本
3
App Cleaner & Uninstaller Pro 8.1.2破解版(无弹窗版本)
4
特斯拉官方二手车捡漏小助手
5
idea 禁用Run Anything (JetBrains全家桶均可以)
luoxx
只要思想不滑坡,办法总比困难多
累计撰写
46
篇文章
累计创建
53
个标签
累计收到
587
条评论
栏目
首页
笔记
项目
软件下载
归档
友情链接
留言板
搜索
标签搜索
微信小程序
特斯拉
jetbrains
摸鱼阅读
tauri
rust
软件
天气
workflow
goaccess
微信
云服务器
gcp
广告联盟
vuetify
jsoup
爬虫
mysql
语音合成
讯飞
cleanmymac
imazing
pd
软件下载
synergy
windows
mac
Gravatar
css
stylus
谷歌搜索
nginx
halo集群
halo
http代理
socks5限速
socks5
腾讯云
mount
ohmyzsh
zsh
centos
puppeteer
seo
utools
react
vue
数据库
datagrip
springboot
linux
javascript
java
目 录
CONTENT
以下是
jsoup
相关的文章
2022-05-24
js 格式化文章格式(字符串多个换行合并)
爬虫爬到的文章格式千奇百怪,格式一点都不整齐,非常不美观。前端需要特殊处理才能使文章内容格式整齐。前言jsoup爬虫从网页上爬到的文章内容,保存到数据库的之后才发现格式千奇百怪,基本上没办法通过单个正则表达式来概括并且完全格式化这些文章,所以只能在前端做处理,拿到文章内容后在前端代码里面吧内容格式调
2022-05-24
772
0
1
笔记
2022-05-07
解决Jsoup抓取网页部分中文乱码(生僻字、繁体字)乱码
偶然发现我用jsoup爬的内容,有一部分中文里面有个别�乱码,但是同一个网页绝大部分中文都是正常的,只有极个别乱码,几经周折终于解决了这个问题,记录以备查查找问题对比源网页,发现乱码的地方都是一些生僻字或者繁体字,比如 ”郃“ 、 ”祂“ 、 ”個“所以我几度怀疑是我的linux服务器字体不全导致的
2022-05-07
1053
0
2
笔记