A “word-wrap” functionality(一个字符串包裹函数)
问题描述
下面是有关这个问题的描述部分。
英文
We are building a word processor and we would like to implement a “word-wrap” functionality.
Given a list of words followed by a maximum number of characters in a line, return a collection of strings where each string element represents a line that contains as many words as possible, with the words in each line being concatenated with a single ‘-’ (representing a space, but easier to see for testing). The length of each string must not exceed the maximum character length per line.
Your function should take in the maximum characters per line and return a data structure representing all lines in the indicated max length.
中文
我们希望构建一个字符串处理函数,这个字符串处理函数将会对给定输入的字符串和参数进行处理。
我们首先将会定义一个字符串的数组,在这个字符串的数组中每一个元素都是存储为一个单词,同时我们将会给出一个整数类型的参数。你的方法将会对上面输入的 2 个参数进行运算,在每一个单词和每一个单词之间会添加一个字符 ”-“ 来进行区分,同时新生成的数组或者 List 每一元素的字符串长度将不能超过给出的字符串的长度。
如果你新生成的元素是以横杠结尾的话,那么你需要删除这个横杠。
样例
下面给出了这个问题的示例,以便于你参考。
输入参数 1 | 输入参数 2 | 输出 |
---|---|---|
words1 = [ “The”, “day”, “began”, “as”, “still”, “as”, “the”, “night”, “abruptly”, “lighted”, “with”, “brilliant”, “flame” ] | 13 | [ “The-day-began”, “as-still-as”, “the-night”, “abruptly”, “lighted-with”, “brilliant”, “flame” ] |
words1 = [ “The”, “day”, “began”, “as”, “still”, “as”, “the”, “night”, “abruptly”, “lighted”, “with”, “brilliant”, “flame” ] | 20 | [ “The-day-began-as”, “still-as-the-night”, “abruptly-lighted”, “with-brilliant-flame” ] |
words2 = [ “Hello” ] | 5 | [ “Hello” ] |
words3 = [ “Hello”, “world” ] | 5 | [ “Hello”, “world” ] |
words4 = [“Well”, “Hello”, “world” ] | 5 | [ “Well”, “Hello”, “world” ] |
words5 = [“Hello”, “HelloWorld”, “Hello”, “Hello”] | 20 | [ “Hello-HelloWorld”, “Hello-Hello” ] |
上面给出的是是测试用的示例,其中输入参数 words1 到 5 就是定义的变量名而已,不需要过度关注。
思路点评和源代码
这个题目的难度还是比较大的,尤其是在没有开发工具进行编译的时情况下。
这个题目是 indeed.com 的一个在线面试测试题。这个公司的在线面试测试使用的是第三方公司提供的评估工具,主持面试的人可能是对技术并不是非常了解的人,或者是对技术比较了解的人,我们不清楚具体的情况。
但是在面试过程中,他们只注重程序的输出和面试的结果,至于你的思路或者你的想法,主持面试的人可能并不十分关注,同时也不怎么会听你的解释,很多时候你都会是在自言自语。
整体感觉面试互动很少,更多的时候是你在对着屏幕说话。
最开始的时候,我的思路是首先对给出的数组进行遍历,当取得第一个元素的时候,将元素后面添加横杠,然后与长度进行对比,如果长度超过了给定的长度的话那么就删除横杠后压入需要返回的列表中。
如果长度少于返回的长度,那么再取出下一个元素,同时再结尾再添加横杆后进行判断,然后再确定横杠的处理。
这个题目的主要问题就在于横杠的处理,有时候横杠在结尾,有时候横杠在开头,你需要一个一个判读。
在随后的测试中,我发现一直是横杠处理不好,结果导致没有完全通过最后的测试,就是上面测试用例的第二行。
思路 2
因为这个题目时间有限,并且我们还不能使用 StringUtils 来进行一些快速的字符串处理,因此我没有在规定的时间内完成所有的测试。在随后结束面试后,我再仔细思考了下问题后发现其实我们还可以有其他的办法来进行操作。
我使用下面的思路,并且完成了代码的修改。
首先我们需要将输入的数组变成一个长的字符串,单词之间使用横杠分隔。例如,[ “Hello”, “world” ] 将会变成字符串为:Hello-world。
在完成上面的操作后,我们需要使用一个 while 循环来做。
首先在 while 循环中判读整个字符串长度小于给定的长度,这个时候需要直接返回,然后中断循环。
下一步,对字符串,从头到给定的长度进行截断后获得子字符串,随后对子字符串进行判断,如果这个子字符串是以横杠结尾的话,删除横杠然后压入需要返回的数组,然后更新需要处理的字符串为截断后余下的字符串。
如果按照给定的长度进行截断后,你获得最后的一个字符不是横杠,那么我们就知道你截断到了单词上,获得的子字符串中,找到最后一个横杠,然后获得索引的 ID,在获得这个索引的 ID 后对需要处理的字符串按照索引 ID 进行截断。
然后删除掉最后的横杠压入需要返回的列表中。
在余下的字符串中可能遇到的情况是目前你将会是横杠开头的,因此你还需要删除掉余下字符串中开头和结尾的横杠。
继续上面的处理,直到需要处理的字符串长度小于给定的长度后中断循环。
上图是对上面思路 2 中的算法进行测试后的返回结果,从结果中可以看到满足需要输出的预期。