zend_validate_regex对重音字符不满意


zend_validate_regex not happy with accented characters

所以我正在使用Zend_Framework,我需要验证文本,不仅接受数字和普通字母,还接受一些像"ã"、"ç"等人

......

我相信一个简单的正则表达式验证可以完成这项工作:

    public function SetTitle($title) 
    {
      $validator = new Zend_Validate_Regex('/^[0-9a-zA-ZÀ-ú]+[0-9A-Za-zÀ-ú'''-'.:,; ]{1,50}$/');
      if ($validator->isValid($title)) {
        if ($this->title != $title) {
            $this->title = $title;
        }
      } else {
        throw new MyApp_Projects_ProjectException("This ($title) is not a valid title.");
      }
} //SetTitle

经过下面报告的一些思考,我测试了这样的东西,它确实有效:

public function testIfCanAttributeTitleToProject()
{            
    $someTitle = "some title with ç, á and ã";
    $this->project->SetTitle($someTitle);
    $this->assertEquals($this->project->getTitle(), $someTitle);
}

但是,当我尝试添加验证器以检查表单中的数据时,如下所示:

    $title = new Zend_Form_Element_Text('title');
    $title->setLabel('Nome:')
        ->setOptions(array('size' => '50'))
        ->setRequired(true)
        ->addValidator('Regex', false, array(
            'pattern' => "/^[0-9a-zA-ZÀ-ú]+[0-9A-Za-zÀ-ú'''-'.,: ]{1,50}$/"
            ))
        ->addFilter('HtmlEntities')
        ->addFilter('StringTrim');
    // attach elements to form
    $this->addElement($title);

尝试测试时引发错误

public function testUserCanUseAccentedCharacters() {
   $form = new MyApp_Form_ProjectCreate();
   $formData = array(
       'title' => 'we scream to weird chars like ã é or ç',
       'submit' => true
       );
    $form->process($formData);
}

其中过程函数如下:

public function process($data) 
{
    if ($this->isValid($data) !== true) {
        throw new MyApp_Form_ProjectCreateException('Invalid data!');
    } else {
        $db = Zend_Registry::get('db');
        $projectMapper = new MyApp_Projects_ProjectMapper($db);        
        $project = new MyApp_Projects_Project();
        $project->SetTitle($this->title->GetValue());
        $projectMapper->insert($project);
    }
}

我已经在其他上下文中检查并重新测试了正则表达式,这似乎没问题,但是出于某种原因,即使Zend_Validate本身也可以使用此表达式,表单元素中的验证器也不接受 À-ú 范围内的任何内容......

可以肯定的是,我(仍然(在这里丢失了一些基本的东西......或者当我有更好的方法时,把头撞在墙上......

请问有人可以帮助我吗?

蒂亚,又... :)

'/^[0-9a-zA-ZÀ-ú]+[0-9A-Za-zÀ-ú'''-'. ]{1,50}$/'

嵌入单引号。 这对你有用吗?

"/^[0-9a-zA-ZÀ-ú]+[0-9A-Za-zÀ-ú'''-'. ]{1,50}$/"

更新

还有三件事要尝试。 我不知道 Zend 实现正则表达式的细节,所以我不知道前两个是否有效。

Unicode 字母属性:

"/^([0-9]'p{Letter})+([0-9'''-'. ]'p{Letter}){1,50}$/"

Posix字符类:

"/^([0-9][[:alpha:]])+([0-9'''-'. ][[:alpha:]]){1,50}$/"

暴力枚举您关心的字母:

"/^[0-9a-zA-ZÀÁÂ ...et cetera... øùú]+[0-9A-Za-zÀÁÂ ...et cetera... øùú'''-'. ]{1,50}$/"