递归地将一个文件夹中的文件路径映射到另一个文件夹


Recursively mapping file paths in one folder to another folder

假设我有一个文件夹 (folder_1) ,结构如下:

/folder_1
  /dir_1
     - file_1_1.txt
     - file_1_2.txt
  /dir_2
     - file_2_1.txt
     /dir_2_1
       - file_2_1_1.txt
  - file_1.txt
现在,假设我有另一个文件夹 (folder_2) ,结构如下:
/folder_2
  /dir_1
     - file_1_1.txt
     - default.txt
  /dir_2
     - file_2_1.txt
     - default.txt
  - default.txt

我需要将folder_1中的每个文件映射到folder_2中的文件,这样:

  1. /folder_1/dir_1/file_1_1.txt映射到/folder_2/dir_1/file_1_1.txt
  2. /folder_1/dir_1/file_1_1.txt映射到/folder_2/dir_1/default.txt
  3. /folder_1/dir_2/file_2_1.txt映射到/folder_2/dir_2/file_2_1.txt
  4. /folder_1/dir_2/dir_2_1/file_2_1_1.txt映射到/folder_2/dir_2/default.txt
  5. /folder_1/file_1.txt映射到/folder_2/default.txt

我不是最好的沟通者,所以希望上面的模式对你们有意义。这个问题确实是语言不可知论的,但是用PHP和/或Javascript的答案将是非常伟大的。

到目前为止,我能够在PHP中使用FileIterator, RecursiveDirectoryIterator和一堆自定义类来完成这个任务,这些类提取然后将路径逐个映射到文件。

这让我怀疑我是否错过了一个更简单的方法来做这个简单的映射。也许用正则表达式命名组什么的?

* *编辑:* *

对于folder_1中的每个文件(文件路径),我们是否可以使用正则表达式模式从folder_2中的所有文件路径的映射中找到(减少)最佳匹配?

进一步编辑:

用于将folder_1中的数据文件映射到folder_2中的模板文件。如果folder_1中的文件没有找到folder_2中的精确匹配文件路径(包括filename),则查找default.txt。如果没有找到default.txt,那么我们向上移动一个目录并使用父目录的default.txt。这样,我们继续向上移动目录级别,直到找到第一个default.txt .

首先,使用递归目录扫描器扫描所有folder_2目录树。构建一个包含文件名的散列表,不带folder_2前缀。所以你的哈希表将包含:

/dir_1
/dir_1/file_1_1.txt
/dir_1/default.txt
/dir_2/file_2_1.txt
/dir_2/default.txt
/default.txt
现在,开始扫描folder_1。当您获得一个文件时,从前面去掉folder_1,并在哈希表中查找结果字符串。如果它在那里,那么你有一个匹配。

如果文件不存在,将最后一段替换为"default.txt",然后重试。所以,当你开始扫描folder_1时,你会得到:

/folder_1/dir_1/file_1_1.txt

你在哈希表中查找dir_1/file_1_1.txt并找到它。你有一个匹配。

接下来,你得到/folder_1/dir_1/file_1_2.txt。你在哈希表中查找/dir_1/file_1_2.txt,但没有找到它。所以你用default.txt代替file_1_2.txt,得到/dir_1/default.txt。你在哈希表中查找它,找到它,你就有了一个匹配。

现在,如果/dir_1/default.txt不存在,那么您将再次调整文件名以删除最后一个目录。也就是说,您要删除/dir_1,然后在哈希表中查找/default.txt

在伪代码中是这样的:
for each file in folder_1
    name = strip `/folder_1` from the name
    if name in hash table then
        match found
        continue (next file)
    end if
    replace file name (everything after the last '/') with "default.txt"
    do
        if name in hash table then
            match found
            continue (next file)
        end if
        remove the last slash, and everything between it and the previous slash.
        (so "/dir_1/default.txt" becomes "/default.txt")
    while name.length > 0
    // if you get here, no match was found
end for