正则表达式解析问题,我正在为Drupal集成视频提供商模块。
对于基本的视频页面,url是这样的:http://v.ku6.com/show/EJEiKXHN1avFezNi.html所以这个正则表达式可以很好地解析视频代码:"@v.ku6.com/show/([^ ',/] +) .html@i",
但是许多页面使用这种模式http://v.ku6.com/special/show_4086312/ZP0DCEnRVpK4BiEU.html所以我需要提取"ZP0DCEnRVpK4BiEU",但排除那里的随机4086312数字。
这里是我到目前为止的正则表达式的东西:"@v.ku6.com/special/show_(是什么?)/((^"'和/]+).html@i",
what goes here?
: 'd+
(数字)
试试这个:
@v.ku6.com/special/show(?:_'d+)?/([^"'&/]+).html@i
(?:)
是一个非捕获组,之后的?
表示它可以在那里或不存在,'d+
至少是一个数字