shell脚本字符串替换在巨大的文件中


shell script string replace in huge file

我需要解析一个巨大的页面。。。有一些像这样的字符串:

<li class="specialclass"><a href="http://some.changingurl.com" ..(some changing classes)..>

我需要将以上更改为:

<li class="specialclass">http://some.changingurl.com<a href="http://some.changingurl.com" ..(some changing classes)..>

然后稍后我可以删除所有的html标签,但保存url。只有url在更改。

请帮我写一篇论文。

谢谢。

sed -r 's/<a href="([^["]*)"/'1&/' input-file >new-file 

这个oneliner就成功了。